因子分析到底有什么用处?
展开全部 问题:大家觉得因子分析到底有什幺用处呢?把原来很多个影响因素归纳成几个影响因子,如果不继续做回归或者聚类的话,光做因子分析有价值吗?答复:因子分析是将多个实测变量转换为少数几个综合指标(或称潜变量),它反映一种降维的思想。
通过降维将相关性高的变量聚在一起,从而减少需要分析的变量的数量,而减少问题分析的复杂性。
在你对问题系统结构不了解时候,因子分析可以根据数据内在逻辑性,把它归并成几个公因子,每个公因子分别代表空间的一个维度,如果经过正交或斜 交旋转的话,各个维度之间可以认为是不相关的,这些公因子能够相对完整地刻画对象的体系维度,最起码累计方差贡献率大于85%的话,就基本能够保证重要信 息不丢失了。
一句话,你如果对研究对象到底应该分为几个维度不清楚的话,用因子分析可以通过数据内在逻辑告诉你。
但如果你对研究对象体系比较清楚的话,那你直接确定维度,通过AHP计算出权重,就能够把系统表述清楚了。
但这里面有巨大问题,单纯通过数据内 在逻辑来判断维度,常常是错误的,而主观判断其实更加科学,并非象统计学宣称的,数据说话才有发言权。
真正有发言权的,是你对问题的经验认识程度。
人们为 了避免被人嘲笑主观判断的失误,而越来越选择了统计分析,实际上,他们并不清楚,单纯用统计分析来做判断,才是最愚蠢的。
只有主客观结合起来,才是相对科 学的,两者矛盾的时候,应该深入研究矛盾的根源,搞不清楚的话,我认为指标体系评价法要远比统计分析准确的多。
而变量之所以能分布在不同的因子内,则是由 于其方差波动性大小和变量之间的相关性决定的,波动性越大,越排在前面的公因子中,各个公因子之间的变量是不相关的,而每个公因子之间的变量是相关的。
因 子分析认为那些数据波动大的变量对对象影响作用更大,它们排在公因子的前列,这样单纯从数据逻辑来判断的准则你认为对吗?我想,如果管理和社会科学都这幺 认为的话,那错误将大大增加了。
上面想法是我这两年做课题的体会,没有在任何一本书上看过相关说法,也许说的不对,这是我个人看法。
如果让我选择的话,我 宁愿用指标体系评价法,体系几个维度事先就清楚,最多先用因子分析算算,看看数据波动性如何,到底能确定几个维度,只起辅助作用。
研究者就是专家,指标体 系的维度由主观来做判断,这主要来自经验判断,而不是由数据判断,我认为其实更科学。
当然,如果你对问题一无所知,那指标体系评价法用AHP来做的话,错 误很可能更多。
我以前就强烈批判过AHP。
说到底,没有一种评价方法是好的,说明问题就好。
问题:那能对LISREL进行类似于因子分析的探索性因素分析了解吗?能给点评价么?3x答复:下面是探索性分析的原理: 传统上所谈的因素分析)factor analysis)指的是探索性因素分析)exploratory factor analysis),它的目的是在承认有测量误差的情形下,尝试用少数的因素)factors)以解释许多变项间的相关关系。
随着统计理论及电脑计算上的进展,目前因素分析的方法可分成探索性因素分析)exploratory factor analysis,EFA)及验证性因素分析)confirmatory factor analysis,CFA),这两类分析之间的差别在于研究者对研究变项间因素结构的了解程度不同。
如果研究者对资料内所含的因素性质,结构及个数不是很 清楚,则可使用探索性因素分析试图找出能解释资料变项间相关关系的少数几个重要因素。
若研究者从过去文献中的理论及自己的研究经验,而对资料间因素之数 目,结构有一定程度的了解及假设,则可使用验证性因素分析来验证该假设是否能解释资料变项间的共变关系。
探索性因素分析需考虑的步骤包括:估计共通值) communalities),决定因素的数目,估计因素负荷量,对因素做转轴)rotation)以得最好的结果,最后则为对结果作解释。
验证性因素分 析则需考虑对因素结构关系之确立)model specification),是否能对参数找出单一组解)identification),参数的估计法)estimation),检验资料与假设模式 之间的适合度)evaluation)。
比较二者,EFA算是探索可能的因素结构之一种方法,而CFA则是验证假设因素结构存在的方法,因此CFA较 EFA对模式使用了较多的假设,也多了模式检验的过程。
除了以上这两类的分析外,读者可能还听过结构方程模式)structural equation modeling,SEM),其所常使用的分析软体包括:LISREL,EQS,AMOS,Mplus等。
结构方程模式是用在对因素间之关系更明确时,其 模式中可含有许多潜在变项及观察变项,研究者对各变项间之关系有一定程度之了解及假设,并可经由检验此假设模式并经过模式之修正及再检验后,确立最后可解 释资料的模式,以了解资料变项间之关系。
用spss软件做的因子分析得到的结论都是什么意思
SPSS操作步骤及解释:1.导入数据 :文件-打开-数据;2.将数据标准化:分析-描述统计-描述,得到标准化数据;3.对标准化数据因子分析:分析-降维-因子分析-导入变量-描述 得到的相关系数矩阵值越接近1,说明相关性越大,因子分析前提存在;Bartlett 检验的 F 值等于0.000,表明数据呈正态分布,KMO 检验值如果大于0.5,说明对 数据进行因子分析适宜。
spss是什么软件,用来干什么。
SPSS是一个统计功能非常完善的软件SPSS软件的特点 一、集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体。
从理论上说,只要计算机硬盘和内存足够大,SPSS可以处理任意大小的数据文件,无论文件中包含多少个变量,也不论数据中包含多少个案例。
二、统计功能囊括了《教育统计学》中所有的项目,包括常规的集中量数和差异量数、相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能在屏幕(或打印机)上显示(打印)如正态分布图、直方图、散点图等各种统计图表。
从某种意义上讲,SPSS软件还可以帮助数学功底不够的使用者学习运用现代统计技术。
使用者仅需要关心某个问题应该采用何种统计方法,并初步掌握对计算结果的解释,而不需要了解其具体运算过程,可能在使用手册的帮助下定量分析数据。
三、自从1995年SPSS公司与微软公司合作开发SPSS界面后,SPSS界面变得越来越友好,操作也越来越简单。
熟悉微软公司产品的用户学起SPSS操作很容易上手。
SPSS for Windows界面完全是菜单式,一般稍有统计基础的人经过三天培训即可用SPSS做简单的数据分析,包括绘制图表、简单回归、相关分析等等,关键在于如何进行结果分析及解释,这一方面需要学习一些数理统计的基本知识,另一方面也要多进行实践,在实践中了解各种统计结果的实际意义。
主成分分析与因子分析的异同和spss软件
因子分析1输入数据。
2点Analyze 下拉菜单,选Data Reduction 下的Factor 。
3打开Factor Analysis后,将数据变量逐个选中进入Variables 对话框中。
4单击主对话框中的Descriptive按扭,打开Factor Analysis: Descriptives子对话框,在Statistics栏中选择Univariate Descriptives项要求输出个变量的均值与标准差,在Correlation Matrix 栏内选择Coefficients项,要求计算相关系数矩阵,单击Continue按钮返回Factor Analysis主对话框。
5单击主对话框中的Extraction 按钮,打开如下图所示的Factor Analysis: Extraction 子对话框。
在Method列表中选择默认因子抽取方法——Principal Components,在Analyze 栏中选择默认的Correlation Matrix 项要求从相关系数矩阵出发求解主成分,在Exact 栏中选择Number of Factors;6, 要求显示所有主成分的得分和所能解释的方差。
单击Continue按钮返回Factor Analysis主对话框。
6单击主对话框中的OK 按钮,输出结果。
求 用因子分析法确定权值 ??(用SPSS软件)。
。
。
模糊聚类分析是聚类分析的一种。
聚类分析按照不同的分类标准可以进行不同的分类。
就好像人按照性别可以分成男人和女人,按照年龄可以分为老中青一样。
聚类分析如果按照隶属度的取值范围可以分为两类,一类叫硬聚类算法,另一类就是模糊聚类算法。
隶属度的概念是从模糊集理论里引申出来的。
传统硬聚类算法隶属度只有两个值 0 和 1。
也就是说一个样本只能完全属于某一个类或者完全不属于某一个类。
举个例子,把温度分为两类,大于10度为热,小于或者等于10度为冷,这就是典型的“硬隶属度”概念。
那么不论是5度 还是负100度都属于冷这个类,而不属于热这个类的。
而模糊集里的隶属度是一个取值在[0 1]区间内的数。
一个样本同时属于所有的类,但是通过隶属度的大小来区分其差异。
比如5度,可能属于冷这类的隶属度值为0.7,而属于热这个类的值为0.3。
这样做就比较合理,硬聚类也可以看做模糊聚类的一个特例。
你说的动态模糊分析法我在文献里很少见到好像并不主流,似乎没有专门的这样一种典型聚类算法,可能是个别人根据自己需要设计并命名的一种针对模糊聚类的改进方法,这个不好说了就。
我见过有把每个不同样本加权的,权值自己确定,这样就冠以“动态"二字,这都是作者自己起的。
也有别的也叫”动态“的,可能也不一样,似乎都是个别人自己提出的。
至于文献,你可以到中国知网搜索博士或者硕士毕业论文,有关模糊聚类为题目的,在第一章引言里面必然会有详细的介绍,或者联系我,我就是做这方面的。
希望能对你有所帮助,给点分吧,打的挺累的。
大数据分析工具有哪些,有什么特点?
1. 开源大数据生态圈Hadoop HDFS、Hadoop MapReduce, HBase、Hive 渐次诞生,早期Hadoop生态圈逐步形成。
开源生态圈活跃,并免费,但Hadoop对技术要求高,实时性稍差。
2. 商用大数据分析工具一体机数据库/数据仓库(费用很高)IBM PureData(Netezza), Oracle Exadata, SAP Hana等等。
数据仓库(费用较高)Teradata AsterData, EMC GreenPlum, HP Vertica 等等。
数据集市(费用一般)QlikView、 Tableau 、国内永洪科技Yonghong Data Mart 等等。
前端展现用于展现分析的前端开源工具有JasperSoft,Pentaho, Spagobi, Openi, Birt等等。
用于展现分析商用分析工具有Cognos,BO, Microsoft, Oracle,Microstrategy,QlikView、 Tableau 、国内永洪科技Yonghong Z-Suite等等。