输入好问卷后如何分析数据?
当我们的问卷拿回调查数据后,要做的就是使用相关的统计软件进行处理。这里我们用spss作为处理软件来简单说明一下问卷处理过程,大致可以分为定义变量、数据录入、统计分析、结果保存四个过程。下面将从这四个方面详细介绍问卷处理。
Spss处理:
步骤1:定义变量
在大多数情况下,我们需要从头开始定义变量。打开SPSS后,我们可以看到一个类似excel的界面。在界面的左下角,我们可以看到两个选项卡,数据视图,变量视图。只需点击左下角的变量视图选项卡,切换到变量定义界面,开始定义新的变量。在表格的顶部,您可以看到要为变量设置的以下项目:名称(变量名)、类型(变量类型)、宽度(变量值宽度)、小数(小数位)、标签(变量标签)、值(定义特定变量值的标签)、缺失(定义变量缺失值)、列(定义显示列宽)和对齐(定义显示列宽)。
我们知道在spss中,我们可以将一份问卷上的每一个问题设置为一个变量,这样一份问卷有多少个问题就会有多少个变量与之对应,每一个问题的答案就是变量的值。现在我们以问卷的第一个问题为例来说明变量的设置。为了便于解释,我们可以假设这个标题为:
1.你属于以下哪个年龄段?
答:20-29岁乙:30-39岁丙:40-49岁丁:50 - 59岁
那么我们的变量设置可以如下:name表示变量名为1,type表示可以根据答案的类型设置类型,我们可以用1,2,3,4来代替A,B,C,D进行答案,所以我们选择numeric,也就是我们选择numeric,宽度为4,decimal表示小数位数为0(因为答案没有小数点)。Values用于定义特定变量值的标签。单击值框右半部分的省略号,打开变量值标签对话框。在第一个文本框中输入1,在第二个文本框中输入20-29,然后单击添加。同样,我们可以做如下设置,即1 = 20-29,2 = 30-39,3 = 40。Missing用于定义变量的缺失值。单击“缺失”框右侧的省略号,打开“缺失值”对话框,界面上有三个单选按钮的列表。默认值为顶部“无缺失值”;第二项是“不连续缺失值”,最多可以定义3个值;最后一项是“缺失值范围加一个可选缺失值”,这里不设置默认值,如图选择第一项;columns,定义显示列宽,可以根据实际情况设置;Align,定义显示对齐方式,包括左对齐、右对齐和居中对齐;Measure,定义变量类型是连续的、有序的还是无序的。
以上是问卷中常见单项选择题的变量设置,下面还会讲解一些特殊情况的变量设置。
1.开放式问题的设置:填空题如你所在的省份是_ _ _ _ _为开放式问题。在设置这些变量时,只需要留下值和遗漏值。
2.选择题的变量设置:这类题有两种设置方式,多重二分法和多重分类法。这里我们只介绍多重二分法。这种方法的基本思想是将问题的每个选项设置为一个变量,然后将每个选项拆分为两个选项,即选中此项和不选中此项。现在我们举一个例子来说明在spss中的具体操作。例如:
你通常通过什么方式获取新闻
1报纸2杂志3电视4广播5网络
在spss中设置变量的时候,这个问题可以设置五个变量。如果是问卷的第三个问题,那么变量名分别是3_1,3_2,3_3,3_4,3_5,然后每个选项有两个选项勾选和不勾选。在Value项中设置为1= checked即可。
使用此窗口,我们可以在此窗口中一次性将问卷中的所有问题定义为变量。
至此,我们定义变量的工作基本可以完成了。我们下一步需要做的是数据输入。首先,我们需要返回到数据输入窗口,这非常简单,只要我们点击软件左下方的数据视图选项卡。
第2步:数据输入
有许多方法可以输入Spss数据,大致如下:
1.以SPSS格式读取数据
2.读取Excel和其他格式的数据
3.读取文本数据(固定和分隔符)
4.读取数据库格式的数据(分为以下两步)
(1)配置ODBC (2)在SPSS中使用ODBC和数据库。
不过问卷的数据录入其实很简单,直接在spss的数据录入窗口录入就可以了,不过这里有几点需要注意。
1.在数据录入窗口中,我们可以看到一个表格,这个表格中的每一行都代表一个调查问卷,也称为案例。
2.在数据输入窗口中,我们可以看到1,2,3,4,5的标签名称...出现在表格的顶部,实际上是我们在第一步中为问卷中的每个问题取的变量名,即1代表第一个问题。2代表第二个问题,以此类推。我们只需要在变量名下输入相应问题的答案,就可以完成问卷的数据录入。比如在问卷上勾选A的答案,我们在1下面输入1就可以了(别忘了我们一般都是用1,2,3,4来代替A,B,C,D)。
我们知道一行代表一个问卷,所以如果有问卷,一定有几行数据。
数据录入完成后,我们需要做的就是对问卷的统计分析,这是我们的关键部分,因为此时我们已经将问卷中的数据录入到了我们的软件中。
第三步:统计分析
有了数据,就可以利用SPSS的各种分析方法进行分析,但是选择哪种统计分析方法,也就是调用哪种统计分析过程,才是得到正确分析结果的关键。这取决于我们调查问卷的目的和我们想要什么样的结果。SPSS有两种方法:数值分析和图形分析。
1.绘图分析:
在SPSS中,除了生存分析中使用的生存图被集成到分析菜单中,其他的统计绘图功能都放在图形菜单中。菜单分为以下几个部分:
(1)图库:相当于一个自学指南,简单介绍了统计绘图功能,初学者可以通过它对SPSS的绘图能力有一个大概的了解。
(2)交互式:交互式统计图。
(3)地图:统计地图。
(4)下面的其他菜单项是我们最常用的一般统计图,具体来说:
条形图
散点图
线图
柱状图
馅饼
区域地图
箱形图
正常Q-Q图
正常P-P图
质量控制图
帕累托图
自回归曲线
高度图
交叉相关图
序列图
光谱图
误差图
画图分析简单易懂,一目了然。我们可以根据自己的需求选择需要制作的图形。一般来说,我们常用条形图、直方图、正态图、散点图、饼状图等。具体操作很简单。可以参考相关书籍。绘图分析更多时候是结合数值分析来分析试卷,效果更好。
2.数值分析:
SPSS的数值统计分析过程是在Analyze菜单中进行的,包括:
(1),报表与描述性统计:又称基本统计分析。基础统计分析是其他更深入的统计分析的前提。通过基本的统计分析,用户可以更准确地把握分析数据的整体特征,从而选择更深入的分析方法来研究分析对象。报告和描述性统计命令项中包含的功能是单变量的描述性统计分析。
描述性统计包括以下统计功能:
频率(频率分析):功能:了解变量的分布。
描述词:功能:了解数据的基本统计特征,将指定的变量值标准化。
探索:功能:考察数据的奇异性和分布特征。
交叉表:功能:分析事物(变量)之间的相互作用和关系
报告包括以下统计功能:
OLAP立方体:功能:根据分组变量,计算每组的总数、平均数和其他统计数据。输出报告摘要是指每组中包含的各种变量的统计信息。
案例摘要:查看或打印所需的变量值。
行报表汇总:以行的形式输出报表。
列式报表汇总:以列的形式输出报表。
(2)比较均值:样本均值能否用来估计总体均值?两个变量均值接近的样本是否来自同一总体?换句话说,两组样本具有不同的变量均值。差异有统计学意义吗?你能解释一下总体差异吗?这是各种研究工作中常见的问题。这需要一个均值比较。
以下是平均值对比测试的过程:
均值过程:不同层次(不同群体)的描述性统计,如男女平均工资、各工种平均工资等。目的是比较。术语:级别数(指分类变量的值的个数,例如一个性别变量有两个值,称为两个级别)、单元格(指按分类变量的值分组的因变量)、级别组合。
t检验过程:对样本进行t检验的过程。
单样本t检验:检验单个变量的均值是否与给定常数不同。
独立样本的t检验:检验两组不相关样本是否来自均数相同的总体(均数是否相同,如男女平均收入是否相同,是否有显著差异)
配对t检验:检验两组相关样本是否来自均数相同的总体(前后比较,如训练效果和治疗效果)
单向方差分析:单向方差分析用于检验几个(三个或三个以上)独立组是否来自同一人群。
(3)方差分析模型:方差分析是检验多组样本均值之间的差异是否具有统计显著性的方法。比如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种作物产量的影响;不同饲料对家畜增重的影响可以通过方差分析解决。
(4)相关分析:是研究变量之间接近程度的常用统计方法。常用的相关性分析包括以下类型:
1,线性相关分析:研究两个变量之间的线性关系的程度。用相关系数r来描述。
2.偏相关分析:描述了在控制了一个或几个其他变量的影响时,两个变量之间的相关性,如控制了年龄和工作经验的影响,估计了工资收入与受教育程度的相关性。
3.相似性度量:两个或多个变量、两组或两组观察值之间的关系有时可以用相似性或不相似性来描述。相似性度量用大值来表示非常相似,而相异度用距离或相异度来描述,大值表示相距很远。
(5)、回归分析:作用:寻求相关(相关)变量之间的关系。在回归过程中,包括:Liner:线性回归;曲线估计:曲线估计;二元逻辑斯蒂:二元逻辑斯蒂回归;多项逻辑斯谛:多元逻辑斯谛回归;有序回归;Probit:概率单位回归;非线性:非线性回归;权重估计:加权估计;2阶段最小二乘法:两阶段最小二乘法;最佳标度最佳编码回归;最常用的是前三种。
(6)非参数检验:是指在总体不服从正态分布且分布未知的情况下,用来检验数据是否来自同一个一般假设的一种检验方法。命名这些方法是因为它们通常不涉及整体参数。
非参数检验的过程如下:
1.卡方检验
2.二项式检验二项式分布检验
3.运行测试运行测试
4.1样本柯尔莫哥洛夫-斯米尔诺夫检验单样本安德雷·柯尔莫哥洛夫-米诺夫检验。
5.2独立样本测试两个独立样本测试
6.独立样本检验
7.2相关样品测试两个相关样品测试
8.k相关样本检验两个相关样本检验
(7)、数据还原(因子分析)
(8)、分类(聚类和判别)等等。
以上是对数值统计分析的分析菜单下用于分析的几种数值统计分析方法的简单介绍。在我们的变量定义和数据录入完成后,我们可以根据自己的需要选择上述几种分析方法对我们的问卷数据进行统计分析,得到想要的结果。
第四步:保存结果。
我们的spss软件会把我们统计分析的很多结果保存在一个窗口里,也就是结果输出窗口。因为spss软件支持复制粘贴功能,所以我们可以将想要的结果复制粘贴到我们的报表中,当然我们也可以执行菜单中的file->命令。保存以保存我们的结果。一般来说,我们建议保存我们的数据,但不是结果。因为只要我们有了数据,只要我们愿意,随时可以利用数据得出结果。
总结:
以上是spss处理问卷的四个步骤。经过这四个步骤,我们需要spss软件的工作就基本结束了,接下来的任务就是写我们的统计报表了。值得一提的是,spss是一个在社会统计中广泛使用的统计软件。学好它对我们今后的工作和学习都有很大的意义和作用。
在SPSS的问卷分析中,一份问卷就是一个案例。首先,应根据不同的问卷问题定义变量。定义变量有两个值得注意的点:一是区分变量的度量和度量的值,其中标度是量化的,序数是序数,名词性是指定类;其次,注意定义不同的数据类型。
各种问卷题目的类型大致可以分为四种:单项选择、多项选择、排序和开放式题目。它们的变量以不同的方式定义和处理。我们将举例详细介绍如下:
1选择题:答案只能有一个选项。
示例1您的组织目前是否有面向组织的职业规划系统?
a有B,正在开始,C没有D,但是已经中断了。
代码:只定义了一个变量,1,2,3,4的值分别代表A,B,C,d四个选项。
回车:输入选项对应的值;如果选择了C,请输入3。
2选择题:答案可以有多个选项,包括不定项数的多选和固定项数的多选。
(1)方法1(二分法):
你的职业规划系统涵盖哪些群体?当你画一个钩子的时候,请把所有的提示放进去。
把它考虑进去。
a月工b日工c小时工
编码:每个对应的选项定义为一个变量,每个变量的值定义如下:不选“0”,选“1”。
输入:回答者选择的选项输入1,不选0。如果回答者选择AC,则三个变量分别输入为1,0和1。
(2)方法二:
你认为开展保持共产党员先进性教育活动最重要的三个目标是什么?
1( ) 2 ( ) 3( )
a、提高党员素质B、加强基层组织C、坚持发扬民主。
D.激发企业家热情e .为人民服务f .推动一切工作。
编码:定义了三个变量来表示题目中1,2,3的括号,三个变量的值都是由对应的选项定义的,分别是“1”a,“2”b,“3”c,“4”d,“5”e,“6”f。
输入:1,2,3,4,5,6的输入值分别代表选项ABCDEF,在每个括号对应的变量下对应输入。如果回答者在三个括号内选择ACF,则在三个变量下分别输入1,3,6。
注意:可以用方法2编码的选择题也可以用方法编码,但不确定项的选择题只能用二分法编码,即方法1是选择题的一般处理方法。
3排名问题:对选项的重要性进行排名。
例4当你购买商品时,你对商品的关注顺序是(请填写代码并重新排列)。
第一、第二、第三、第四和第五。
代码:定义了五个变量,可以分别代表第一位和第五位。每个变量的值定义如下:“1”品牌,“2”受欢迎,“3”质量,“4”实用,“5”价格。
输入:输入数字1,2,3,4,5分别代表五个选项。如果被调查者将质量排在第一位,则在代表第一位的变量下输入“3”。
4选择排序问题:
案例5将案例3的问题改为“你认为开展保持党员先进性教育活动最重要的是什么?”
目标就是那三项,重要性从高到低排序,选项不变。
编码:根据ABCDEF6的六个选项定义了六个变量,每个变量的值定义如下:“1”不选,“2”排第一,“3”排第二,“4”排第三。
输入:根据变量的值输入。例如,如果在三个括号中选择了ECF,则应分别输入本题六个变量的值:1(代表选项A未被选择),1,3(代表选项C排名第二),1,2,4。
注意:这种方法是选择题和排序题的结合,也适用于一般的排序题(例4),只是它们使用不同的分析方法(例4使用频率分析,例5使用描述性分析),输出的结果从不同的方面反映了问题的重要性(前一种方法从变量出现的频率看排序,后一种方法从变量看排序)。
5开放式数值题和量表题:这些题要求回答者自己填写数值或打分。
例6你的年龄(实际年龄):_ _ _ _ _ _ _ _
代码:没有定义值的变量。
输入:输入被调查人填写的实际值。
6个开放文本问题:
如果可能的话,可以将意思相近的答案进行编码,转换成封闭选项进行分析。如果答案丰富,难以归类,就直接对这类问题进行定性分析。
第三,问卷的一般分析
下面详细介绍SPSS中问卷的一般处理方法。操作以spss13.0版本为例,下面提到的菜单项都在分析主菜单下。
1频率分析:频率过程可作为单变量频率分布表;显示用户在数据文件中指定的变量的特定值出现的频率;获得一些描述值的范围的统计数据和描述值的范围的统计数据。
适用范围:选择题(例1)、排序题(例4)、选择题方法(例3)
频率分析也是问卷分析中最常用的方法。
实施:描述性统计...频率
2描述性分析:Descriptives:该过程可以计算单变量的描述性统计量。这些统计数据包括平均值、算术和、标准差、最大值、最小值、方差、平均值的范围和标准误差等。
适用范围:选择题和排序题(例5),开数值题(例6)。
实施:描述性统计...描述性的,单击统计按钮选择所需的统计。
3多重反应下的频率分析:
适用范围:选择题二分法(例2)
实现:第一步,将多项回答中一个选择题定义的所有变量集合起来……定义集合,命名新的集合变量,在二分法计数值中输入1。第二步,在多个响应……频率下做频率分析。
4跨频分析:解决多变量组合各层次的频率分析问题。
适用范围:适用于两个或两个以上变量交叉分类形成的列联表,分析变量之间的相关性。比如想了解不同工作性质的人在工作中是如何使用交通工具的,可以通过交叉分析得到一个二维频率表,一目了然。
实现:第一步,根据分析目的确定交叉分析的选项,确定控制变量和解释变量(如上例,工作性质不同的人为控制变量,使用交通工具为解释变量)。步骤2:选择描述性统计数据...交叉表。
介绍四种简单的图形描述
在做上述频数分析、描述性分析等分析时,可以直接做一个图,简单方便,也可以再做一个图。SPSS的绘图功能强大,菜单图形下的图形清晰美观。现将常见的图表简要介绍如下。
1饼状图:也称饼状图,是用一个圆的面积来表示所研究对象的人口数,并将该圆的面积按各组成部分在人口中所占的比例分成若干个扇区,以表示现象部分与人口的比例关系的统计图表。频率分析的结果应该用饼图表示。
2曲线图:是说明数据随线段上升和下降而变化的统计图表。主要表现现象在时间上的变化趋势,现象的分布以及两种现象的依存关系。
面积图:强调现象随线段下阴影面积变化的统计图。
条形图:用相同宽度的条形的长度或高度来表示统计数据的大小和变化的统计图表。
五问卷深入分析
除了以上简单的分析,还可以利用spss强大的功能对问卷进行深入的分析,如聚类分析、交叉分析、因子分析、均值比分析(参数检验)、相关分析、回归分析等。因为涉及到非常专业的统计知识,下面只简单介绍一下个人有用的方法的适用范围和分析目的:
1聚类分析
样本聚类可以对调查对象进行分类,并根据这些属性计算出每一类的比例,从而清晰地研究关注的群体。例如,根据受访者的消费特征对其进行聚类。
2相关性分析
相关性分析是针对两个变量或多个变量之间是否存在相关性的分析方法,应根据变量的不同特征选择不同的相关性度量方法。问卷分析中使用的变量大多属于分类变量,应采用Spearman相关系数。
可以采用卡方检验,这是两个变量之间是否存在显著影响的一种分析方法。
3个平均值的比较和检验
(1)均值过程:对指定变量进行综合描述和分析,分组计算均值然后进行比较。比如可以按照性别变量分为男性和女性来研究他们之间的收入是否有差距。
(2)T检验:
独立样本t检验用于检验无关样本是否来自均数相同的总体。例如,研究购买该产品的客户和不购买该产品的客户之间的收入是否存在显著差异。
如果样本不独立,应使用配对t检验。比如研究参加职业培训后工作效率是否提高。
4回归分析
在问卷分析的回归分析中,离散回归模型,通常是logistic模型,常用于解释一个变量对另一个变量的影响程度。比如研究收入对一种商品消费的影响。