Mplus&SPSS—探索性因素分析(Exploratory Factor Analysis, EFA)
本文将对探索性因素分析进行简单介绍,分为理论篇和操作篇,理论篇介绍探索性因素分析的相关知识。操作篇介绍探索性因素分析在SPSS与Mplus中的操作方法与结果解读,如仅想了解操作,可直接跳转到操作篇。
目录
(3) KMO测度(Kaiser-Meyer-Olkin measure of sampling adequacy)
(4) Bartlett球形检验(Bartlett’s test of sphericity)
本文将对探索性因素分析进行简单介绍,分为理论篇和操作篇,理论篇介绍探索性因素分析的相关知识。操作篇介绍探索性因素分析在SPSS与Mplus中的操作方法与结果解读,如仅想了解操作,可直接跳转到操作篇。
理论篇
参考书目
- 《高级心理统计》, 刘红云著, 中国人民大学出版社
- 《问卷统计分析实务:SPSS操作与应用》, 吴明隆著, 重庆大学出版社
- 《潜变量建模与Mplus应用·基础篇》, 王孟成著, 重庆大学出版社
因素分析简介
1. 含义
因素分析(Factor Analysis)是一种将描述某一事物的多个可观测的变量(即观测变量)缩减成描述该事物的少数几个不可观测的变量(即潜变量,又称潜在因素)的统计技术。
观测变量:可以直接观测的变量。例如:问卷中的一道题或直接相加的维度分,不会估计误差。
潜变量:通常指不能直接观测的变量,需要借助外显的测量指标来估计。与潜变量类似的概念有很多,如构念(Constructs)、特质(Trait)、因子(Factor)等。
举例:学生的学习能力(潜变量)可用学科成绩(观测变量)例如:语文成绩、数学成绩、英语成绩等)来描述
因素分析通过研究众多变量之间的内部依赖关系,探求观测变量背后的基本结构,并用少数几个有意义、相互独立的因素来表示数据的基本结构。因此,因素分析又被形象地描述为一种“降维”技术,即用几个更具概括性的因素来减少原有维度的技术。这些因素能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系。
2. 种类
按照分析前有无理论基础,因素分析具体可以分为探索性因素分析(Exploratory Factor Analysis, EFA)和验证性因素分析(Confirmatory factor analysis, CFA)两大类。
- 探索性因素分析:一项用来找出多个观测变量的本质结构,并进行降维处理的技术。用于探索心理结构的维度构成
- 验证性因素分析:用来检验因素与相对应的测度项之间的关系是否符合研究者所设计的理论关系的技术。用于检验心理结构的理论假设。
如果对所研究的心理行为变量不清楚,对观测数据背后存在的因素知之甚少,可以通过运用探索性因素分析帮助人们简化数据,了解这个心理行为变量具体包括哪些因素,而如果研究者根据理论,或者其他一些已有的研究对这个心理行为变量所包含的格式与结构做出了假设,那么就可以运用验证性因素分析,知道研究者所获得的观测数据是否真正测到了这些因素,是否能够验证已有的理论假设。
3. 原理
因素分析理论模型假设:
观测指标(题项、问卷问题、条目)由两部分组成:
- 共同因素 / 共同因子 / 公因子(Common Factor):所有题项 / 条目共同的部分
- 独特因素 / 唯一因素(Unique factor)
- 所有的独特因素间彼此没有相关
- 所有的唯一因素与所有的共同因素间也没有相关
- 所有共同因素彼此之间的关系,可能相关,可能不相关
几个重要概念:
- 因素载荷 / 因素负荷 / 因子负荷(factor loading):观测变量与提取出来的共同因素之间的相关系数,载荷的平方可以解释为观测变量的变异有多大程度的比例由某一因素解释。
- 共同度 / 共同性(communality):共同因素解释个别变量的百分比,公共因素替代观测变量后,原来每个变量的信息被保留的程度。
- 特征根:某一公共因素对各观测变量的影响程度,也反映了该公共因素的重要性
4. 目的
- 用较少的因素代表原来较多的变量
- 探索与构建心理构念的结构(EFA)
- 检验心理测验的结构效度(CFA)
探索性因素分析
探索性因素回答的主要问题是:能否从复杂繁多的原始数据中,提取出少数有意义的新维度或潜在变量,即寻求并确定原始数据背后的潜在结构。
在探索性因素分析中,研究者对于能都得到的因素预先并没有潜在的理论假设。因此,探索性因素分析通常用于研究的最初阶段。
探索性因素分析主要用于提取出少数的潜在因素,确定原始数据背后的潜在结构,所以有几个问题需要解决一下:
- 什么样的数据适合做探索性因素分析?
- 探索性因素分析的目的是提取共同因素,用什么方法提取?
- 提取多少个因素?
- 如何解释这些提取出来共同因素?
1. 什么样的数据适合做探索性因素分析?
因素分析的目的是简化数据或者找出基本的数据结构,因此使用因素分析的前提假设包括理论假设和统计假设。
理论假设是指所选的一组变量中,确实存在某种潜在结构。
统计假设是指观测变量之间应该有较强的相关。如果变量之间的相关较小,则他们不可能共享共同因素。
因此,我们可以通过对变量之间的相关进行检验来判断是否适合做探索性因素分析,SPSS提供了一些统计量来判断观测数据是否适合做因素分析。
(1) 样本量
Comrey和Lee(1992)认为:
经验的法则是:样本量应当至少为要分析的变量数的5倍,更被普遍认可的标准是10倍及以上。
(2) 变量间相关矩阵
计算所有变量的相关矩阵,如果所有或大部分相关小于0.3,则不适合做探索性因素分析。
(3) KMO测度(Kaiser-Meyer-Olkin measure of sampling adequacy)
从比较观测变量之间的简单相关系数和偏相关系数的相对大小出发,其值的变化范围为0-1。当所有变量之间的偏相关系数的平方和远远小于简单相关系数的平方和时,KMO值接近1。KMO值较小时,表明不适合对观测变量进行因素分析。通常按以下值来进行解释:
(4) Bartlett球形检验(Bartlett’s test of sphericity)
球形检验结果显著,表明适合做因素分析
2. 探索性因素分析的目的是提取共同因素,用什么方法提取?
因素分析的方法有:
- 主成分分析( 主成分分析是许多软件默认的因素提取方法,但并不是真正的因素分析法(假设分析的变量不含误差),是一种变量缩减的方法。而因素分析中,将观测指标的变异分成了共同因素、独特因素和误差三部分)
- 未加权的最小平方法(unweighted least squares)
- 一般化最小平方法(generalized least squares)
- 极大似然法(maximum likelihood)
- 主轴因素法 / 主轴因子法 / 主轴法(principal axis factoring)
- Alpha因素提取法(alpha factoring)
- 映像分析法(image analysis)
如果数据是正态分布,推荐使用极大似然法。
如果数据是非正态分布,推荐使用主轴法。
3. 提取多少个因素?
对于共同因子数目的确定,目前还没有精确的定量方法,实际应用中,人们借助一些准则来确定因素的个数,常用的有以下几种:
(1) 特征根的准则
特征根的准则要求取特征根大于1的共同因素,而放弃特征根小于1的共同因素
在变量数目≤40,样本量较大的情况下,这个标准通常是正确的
(2) 碎石图检验准则
碎石图检验准则(scree test criterion)要求按照因素被提取的顺序,画出因素的特征根随因素个数变化的散点图,根据图的形状来判断因素的个数。
纵轴:特征值,横轴:因素数目
找到图中斜率明显不同的点(数据曲线变平的断裂点),该点对应的因素之前的因素就是应当抽取的因素。
(3) 因素累积解释方差的比例标准
- 这一标准没有绝对的数值
- 在社会科学中,一般选取的因素数应使累积解释的方差比例达到60%以上就可以
- 50%或80%(Floyd & Widaman, 1995)
(4) Veliver的MAP检验
(5) Horn的平行检验
目前使用较多的方法,可以在Mplus中实现,操作方法请见下面这篇文章。
Mplus—平行分析(Parallel Analysis) - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/601230590实际中,人们很少仅仅依赖某一准则或标准确定因素个数,而是结合几个准则或标准进行判断,并且可能通过进行多次因素分析来确定因素个数。
4. 如何解释这些提取出来的共同因素?
找出了共同因素也就达到了数据简化的目的,但在实际研究中,人们更加关心每个因素的意义。因为会出现各个变量(题项)在每个共同因素上的因素负荷大小差不多的情况,因此根据初始因素解就难以解释各个因素的实际意义。此时就需要因素旋转。
因素旋转的目的在于通过改变坐标轴的位置,使得各变量在各共同因素上的负荷变大或变小,归属关系更加明显,使得因素结构简单并易于解释。
因素旋转的方式有两种:
- 正交旋转法(orthogonal rotations):又称直交旋转法,因素轴之间仍保持90度角,即假设因素之间是不相关的。常用的正交旋转法:四次方最大法(quartimax)、最大方差法(varimax)、等量最大法(equamax)
- 斜交旋转法(oblique rotations):因素之间的夹角是任意的,即假设因素之间可以相关。常用的斜交旋转法:直接斜交旋转法(Direct Oblimin)、Promax斜交旋转法
- 斜交旋转法的要求低于正交旋转法
- 正交旋转法假定提取的因素相互独立,与心理学的构念通常是相关的事实不符
- 斜交旋转法的结果好于正交旋转法
- 正交旋转法的可重复性高于斜交旋转法
决定变量(题项)归属:
- Hari等认为变量应该纳入哪个因素,要考虑到样本量的大小。样本量小,因素负荷的选择标准要高,样本量大,因素负荷的选择标准要高。
- 每个因素至少有3-5个变量
- 因素负荷在0.30以上
- 一个项目不能在两个及两个以上的因素上都有超过0.3的因素负荷
以上就是对因素分析及探索性因素分析的简单介绍。
操作篇
EFA在SPSS中的操作方法与结果解读
操作方法
1. 分析—>降维—>因子分析
2. 选择要分析的变量,添加至右侧“变量”栏中
3. 单击“描述”,统计量下选择“原始分析结果”,相关矩阵下选择“系数”“显著性水平”“KMO和Bartlett的球形检验”
4. 单击“抽取”,方法处选择“主轴因子法”,输出处选择“未旋转的因子解”“碎石图”,抽取处选择“基于特征值,特征值大于1”
5. 单击“旋转”,在方法处选择“最大方差法”
6. 单击“选项”,在系数显示格式处选择“按大小排序”,“取消小系数”,可选可不选,一般选择时,我们在“绝对值如下”中填入.30
结果解读
1. 相关矩阵
2. KMO和Bartlett球形检验
KMO的值为0.978,Bartlett球形检验结果是显著的,满足进行探索性因素分析的前提条件。
3. 总体方差解释率
3个特征根大于1的因素,一共解释了68.109%的变异。
4. 碎石图
5. 未旋转因子载荷
很多变量都存在交叉载荷,因此考虑加入因素旋转的方法。
6. 旋转后因子载荷
EFA在Mplus中的操作方法与结果解读
- 《高级心理统计》P164-171
- 《潜变量建模与Mplus应用·基础篇》P73-86
1. Mplus语句
TITLE: EFA; ! 该语句的名称
DATA: FILE IS aq.dat; ! 数据来源
VARIABLE: NAMES = aq1-aq31; ! 变量名称
MISSING = ALL(99); ! 定义缺失值
USEVARIABLES = aq1-aq31; ! 使用到的变量
ANALYSIS: ROTATION = GEOMIN (oblique); ! 确定因子旋转方法,系统默认GEOMIN,也可选择其他旋转方式
ESTIMATOR = MLR; ! 选择提取公因子的方法
TYPE = EFA 1 4; ! 定义抽取因子的个数从1到4个。如果只抽取特定个数,将两个数字设定为相同即可OUTPUT: STANDARDIZED MOD; ! 输出标准化值和修正指数
PLOT: TYPE IS PLOT2; ! 要求报告碎石图
2. 结果解读
之后分别是一因子、二因子、三因子、四因子模型结果,以四因子模型为例,包括以下部分:模型拟合信息、旋转后因子负荷、因子间相关系数、修正指数等
Plot>View plots,出现如下新界面,点击”确定“,可查看碎石图,横轴为因子数,纵轴为特征值。
以上就是EFA在SPSS和Mplus中的操作方法与结果,希望对大家有帮助!
你的点赞 /收藏⭐️,是最大的支持 !
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)