spss软件怎么输入数据
愁啊,每次出来都是要解释一下楼上的错误……真的是怕误人子弟,错误引导祖国未来的统计学花骨朵。
变量分很多种类这个无容置疑,并不是说每种变量都要尽量录入数值型。
肯定是根据实际需要及情况来进行变量录入。
那么就要来讲关于类似“性别”啊、“工作组”、“班级”甚至“民族”等变量为什么可要用数字代替,注意,数字只是表面显示。
如果是因为简单就用数字代替一些字符变量,那么spss软件通篇都不要字符好了……虽然很多时候某些变量可以用数字取代简单很多没有错,但最深层的含义是为了分组,也就是聚类分析,或者分组统计做准备的。
你可以发现,那些能用数字代替的变量都是具有“分组”意义的变量,男女可分男女生两组,民族可以分1、2、3so on的很多组,班级、工作部门啊,有时年龄段不想要确切年龄都是可以分组。
在统计学中,因为取样多来自抽样调查,聚类分析或者对比分析的意义很重大。
大家想都是将具有某一特征的样本统一起来进行数据分析。
另外,拿“性别”变量为例,还是要设置成字符型变量,在变量窗口中,可以设置此变量“label”来确定1、2分别代表男女,而在数据窗口,你输入1或者2,此时spss会自动显示“男”“女”,所以看似输入数值,实际上还是字符变量的。
至于数据窗口显示问题,你既可以设置我上面说的那种,也可以直接让此变量显示“1”“2”,但是变量本质没有变,所以看的出来,这种代替发放仅是为人工显示及编辑数据所用,并非改变变量本身的属性。
将数据分组 Data——Split File——compare groups,在output中的结果就会显示出按照变量分的“1”“2”等组的信息了。
缺失值是符合现实的一种数据情况,对于缺失值要用科学手段进行代替。
平时我们做小论文和小报告,完全可以选择没有缺失值,就是说你在录入数据时的全部数据都是存在的。
(真有缺失就自己填一个,不怕,我们管这个叫“人工填写”,这可是统计学中第一号处理缺失值的科学方法,不同的是人家要的“人工”可是经验专家啊,呵呵~当然电脑没这个选项)当选择没有缺失值时,Null. 这个就是缺失值的代表,此种情况下如果用户没有输入数据,那么缺失值自动使用0代替。
很多考试题中都会出Null代表0,这是错的!Null是缺失值,只有在选择没有缺失值时才用0代替缺失值。
那么就很好解释其他的那些方法都是处理缺失值的。
离散缺失值是对离散型变量设置的吧,这个我真没什么印象。
其他的方法:Series mean;Mean of nearby points, Median of nearby points;Linear interpolation ;Linear trend at point。
这些英文很简单,不用再解释了。
我想说的是,很多关于统计学基础的知识问题要好好看书,统计学吃不透,对spss的学习会有一定的障碍,而况是Eviews什么的呢。
SPSS 原始数据输入
假设你的问卷为心理量表,回收后,分一下几个步骤: 1、对问卷基本信息编码(问卷的基本信息是指回答问卷者的个人信息,如其学院性别,年龄等)——如性别:男1,女2;学院:1物理2化学……,spss只能处理数据,所以必须然问卷中所以信息变成数据。
心理测量的任务就是给心理属性分配有等级区别数字 2、心理量表通常有几种计分方式,四点计分,五点或者七点两点等,只需分别记为1 2 3 4……就可以。
要是其他形式问卷,可以把a—1,b—2…形式计分,如果有多项选择,而且可以是选项数目任意,记住把这个题可能的最多的选项作为标准,如一题最多可能有4个选项,对于任何单独样本的计分都是记4项,缺少的用空格补全 3、现在可以输入数据了,最简单的就用txt记事本就可以了。
对于每一个样本,首先输入基本信息,然后空格,接着一次输入题目计分,每隔10个题目加一个空格(这样做是为了很容易与前面的输入对比,更容易找到输入过程中的错误),每一行输入一个样本信息 4、所有的都输入好了,就可以导入到spss中了。
file--->open-->data 选择文件类型txt(也可以用excel直接导入)打开,然后点击下一步-->在第二步时候在are varible names included at top of you file?选择yes ——>然后一直按下一步到第四步,用鼠标在data preview视窗点击,分离变量(本来直接导入会使得数据全部在一列的,通过鼠标点击使问卷每一个题目单独成为一列,在spss中每一行为一个case,也就是一个单独样本的得分数据记录,简单说通常是一个人的那一份问卷的全部记录,每一列为一个变量,包括各项基本信息和每一道题目) 如图(再然后一直点击下一步直到完成就可以了,到此可以保存文件了,再对数据变量命名,最好用英文,在变量视窗加上值对应的value,lable,问卷输入基本完成了,这只是最基本的步骤,统计环节更复杂了,统计前还需要对数据进行一定的处理,删除一些不合理数据,这些就太多了,自己看看书,问问同学吧)
数据操作spss软件无法正常录入数据和打开文件,求解(有图)
基于SPSS的聚类分析的实用方法(层次聚类法和迭代聚类法)层次聚类法和迭代聚类法的主要区别在于:层次聚类法的聚类结果受奇异值的影响非常大,且聚类过程是单方向的,一旦某个样本进入某一类,就不可能从该类出来,再归入其他的类;迭代聚类法的聚类结果受奇异值和不合适的聚类变量的影响较小,对于不合适的初始聚类可以进行反复调整,但其缺点是聚类结果对初始聚类非常敏感,而且它也只能得到局部最优解.(一)层次聚类 Analyze--> C1assify-->Hierachical Cluster 在“C1uster”组中选择聚类类型:要进行变量聚类选择指定“Vanables”;要进行观测量聚类指定“Cases”。
指定参与分析的变量,将选定的变量通过按钮箭头转移到箭头按钮右侧的“Variable[s]:”矩形框中;将标识变量通过下面一个箭头按钮转移到按钮右侧的“Label Cases by:”下面的矩形框中。
如果不使用系统默认值,或由于参与分析的变量量纲不一致需要指定选择项,则应该根据需要有选择性地执行下述某些步骤。
1.确定聚类方法在主对话框中,点击“Methed”按钮,展开分层聚类分析的方法选择对话框,即“Hierachical Cluster Analysis:Method”。
在对话框中根据需要指定聚类方法、距离测度的方法、对数值进行转换方法,即标准化数值的方法和对测度的转换方法。
(1)聚类方法选择“C1uster Method:”表中列出可以选择的聚类方法: Between-groups linkage组内连接Within-groups linkage组内连接Nearest neighbor最近邻法Furthest neighbor最远邻法Centroid clustering重心聚类法Median clustering中位数法Ward's method Ward最小方差法。
(后三种聚类方法应与欧氏距离平方法一起使用) 几种方法的具体情况见下面的英文文档(2)对距离的测度方法选择 在Method中指定的是用哪两点间的距离的大小决定是否合并两类。
距离的具体计算方法还根据参与距离的变量类型从以下三种对话框选择其一,展开选择菜单后再进行具体方法的选择。
这三个对话框分别对应于等间隔测度的变量(一般为连续变量)、计数变量(一般为离散变量)和二值变量。
这里只考虑连续变量的情况 “Interval”(系统默认) Euclidean distance:Euclidean距离,即两观察单位间的距离为其值差的平方和的平方根,该技术用于Q型聚类; Squared Euclidean distance:Euclidean距离平方,即两观察单位间的距离为其值差的平方和,该技术用于Q型聚类; Cosine:变量矢量的余弦,这是模型相似性的度量; Pearson correlation:相关系数距离,适用于R型聚类; Chebychev:Chebychev距离,即两观察单位间的距离为其任意变量的最大绝对差值,该技术用于Q型聚类; Block:City-Block或Manhattan距离,即两观察单位间的距离为其值差的绝对值和,适用于Q型聚类; Minkowski:距离是一个绝对幂的度量,即变量绝对值的第p次幂之和的平方根;p由用户指定 Customized:距离是一个绝对幂的度量,即变量绝对值的第p次幂之和的第r次根,p与r由用户指定。
(3)确定标准化的方法:“Transform Value” “Standardize” 下为标准化列表 对数据进行标准化的可选择的方法有: ① None 不进行标准化,是系统默认值。
② Z scores 把数值标准化到Z分数。
③ Range -1to l把数值标准化到-1到+l范围内。
选择该项,对每个值用变量或观测量的值的范围去除。
如果值范围是0,所有值保持不变。
④ Maximum magnituds of 1 把数值标准化到最大值为1。
该方法是把正在标准化的变量或观测量的值用最大值去除。
如果最大值为0,则改用最小值去除,其商加1。
⑤ Range 0 to 1 把数值标准化到0到1的范围内,对正在被标准化的变量或观测量的值剪去最小值,然后除以范围。
如果范围是0,对变量或观测量的所有值都设置成0.5。
⑥ Mean of 1 把数值标准化到一个均值的范围内,对正在被标准化的变量或观测量的值除以这些值的均值。
如果均值是0,对变量或观测量的所有值都加1,使其均值为1。
⑦ Standard deviation of 1 把数值标准化到单位标准差。
该方法对正在被标准化的变量或观测量的值除以这些值的标准差,如果标准差为0,则这些值保持不变。
(4)测度的转换方法选择 对距离测度数值进行转换,在距离计算完成后进行。
可选择的转换方法有三种,在“Methd”对话框右下角的标有“Transform Mearure”的框中选择。
① Absolute Values 把距离值标准化。
当数值符号表示相关方向,且只对负相关关系感兴趣时使用此方法进行变换。
② Change sign 把相似性值变为不相似性值,或相反。
用求反的方法使距离顺序颠倒。
③ Rescale to 0-- 1 range 通过首先去掉最小值然后除以范围的方法使距离标准化。
对于已经按某种换算方法标准化了的测度,一般不再使用此方法进行转换。
2.选择要求输出的统计量:Statistics对话框 Aggomeration schedule 输出聚合过程表 Proximity matrix:输出的是每个案例之间的欧氏距离平方表(Q型聚类)。
Cluster membership决定聚合的群数。
试探性地做时就选none,做完后根据判断的合适的群数在输入确定的群数,这时会得出一个更多的结果cluster membership,即在此群数下,各案例...
spss数据输入
步骤1:在Variable view窗口中输入三个变量:订单金额、销售人员数量、频率 其中的“订单金额”需要在Values中设置变量值标签,看图。
步骤2:切换到Data view窗口中,在对应三个变量下按照你的图样输入数据,注意,订单金额下只要依次输入1,2,3,。
。
。
7即可 步骤3:进行加权操作,菜单Data——weight cases 进去后选weight cases by,将变量“销售人员数量”或“频率”的其中一个放入,点击OK完成操作 步骤4:绘制直方图,菜单Graphs——Histogram 进去后将变量“订单金额”放入Variable窗口,点击OK完成制图。
将最后一步的Histogram调换成bar图,做成条形图,做出条形图后双击编辑图形,将条字之间的SCALE比例调整到100%,使条子挨在一起就形成了直方图(不是办法的办法)。
实际上,只要是叫做 直方图(而不是条形图或柱形图),你无论用什么方式做出来的数值标签都显示的是都是各组的端点或者中间值(比如你这个例子中的1,2,3...),不会出现1-2 2-3 3-4 这样的标签的(除非当作条形图去理解)。
而且SPSS的直方图是用1.3 1.2 2.2 3.6 ...这样的原始数据直接做的,而不是在你给出的频数表基础上做的,所以上面的做法也是一种特殊方式关于箱型图的绘制:绘制本身不是一件难事,关键是这个图需要用到较多的指标,每个从箱子都由最中间的一条粗线,一个方长方框,外沿出来的两条细线,以及上下的一些单独散点组成。
它们分别代表中位数、上下四分位数(即25%和75%分位数)、最值(剔除异常值之后的最大、最小值),剩下的单独点,超过四分位间距1.5倍的用圈表示,超过3倍的极端值用“*”表示。
回到你这个例子中,首先你的数据只适合做近似的箱型图,因为箱型图和直方图一样必须用Scale尺度数据来绘制,而且要精确得到箱子上那些指标值,就必须是原始的数据,现在没有原始数据,而是用1-2 2-3 3-4各组的近似值来绘制,那么绘制的箱型图也是近似的。
具体操作菜单:首先:仍然要按照“人数”或“比重”变量加权其次:graphs---boxplot选择simple,下面选择第2项(如图),点击设置菜单,进入后将“订单金额”变量放入上面这个框,点击OK完成操作,可以得到“订单金额”的近似箱型图
请问单因素方差分析spss数据怎么录入
既然是单因素方差分析,那么你的数据组成: 1 2 3 早上 0.1 0.4 0.5 下午 0.2 0.3 0.6只包含一个因素,就是时间因素,你可以定义早上为1,下午为2,每个时间具有3个重复,那么输入如下1.。
。
。
。
。
0.11。
。
。
。
。
。
0.41.。
。
。
。
。
0.52.。
。
。
。
。
0.22.。
。
。
。
。
0.32.。
。
。
。
。
0.6这样就具有一个自变量,他有1和2两个值;因变量具有6个数值。
在这种情况下,你可以采用T检验,如果早上和下午的三个重复的每一个重复都是同一个个体的话,你需要用配对样本T检验,其输入格式如下(前后可颠倒):0.2.。
。
。
。
。
0.10.3。
。
。
。
。
。
0.40.6。
。
。
。
。
0.5如果早上和下午的数据不存在配对关系,你可以采用独立样本的T检验或者方差分析。
数据采用最上面(也就是具有6行数字的那个)的输入方式。
这个数据用方差分析的话,也不需要多重比较。
大多数Post Hoc的检验方法,一般采用LSD, Tukey, 或者Duncan,它们的计算方法是不一样的,其严格程度是依次降低的,也就是说,LSD最为保守和严格,Duncan在这三种方法中最不严格和最不保守。
从而,同一数据用Duncan检验出来显著性,用LSD则不一定能够检验出来,但是用LSD可以检验出显著性的数据,用Duncan肯定能够检验出来。
LSD有利于避免I型错误,即拒绝实际上成立的原假设的错误类型。
Duncan有利于避免II型错误,即接受实际上不成立的原假设的错误类型。
另外,Duncan适合于多个实验组与一个对照组的多重比较。
Tukey的严格和保守性低于LSD,但高于Duncan....
转载请注明出处51数据库 » spss软件怎么输入数据格式
俺是一朵云