Mplus—潜在类别分析(Latent Class Analysis, LCA)
潜在类别分析的Mplus语句及后续分析。
目录
之前的文章介绍了潜在剖面分析(Latent Profile Analysis, LPA),详细内容可点击下方链接查看。
潜在剖面分析和潜在类别分析(Latent Class Analysis, LCA)均属于潜类别模型(Latent Class Model, LCM),即根据个体在观测指标上的反应模式,将其分到不同的类别中。二者的区别在于前者处理连续观测指标,后者处理分类观测指标。
简介
潜在类别分析(LCA)可以简单理解为:根据个体对分类观测指标的反应特征,将其划分到不同的类别中。
这里涉及几个关键问题:
1. 分类观测指标怎么确定?
——可以是题目得分、维度得分、量表得分,只要是分类变量即可。
2. 将人群分为几类最为合适?
——假设只存在一个类别,然后逐步增加类别数,通过模型比较,确定最佳分类个数。
模型比较采用以下标准:
-
信息评价指标(AIC, BIC, aBIC):越小越好。
-
Entropy指数:表示分类精确程度,取值范围为0到1,越接近1表明分类越精确。
-
似然比指标(LMR, BLRT):显著的LMR、BLRT值表明K个类别的模型优于K-1个类别的模型。
(黄月胜等, 2019)
分析步骤
-
确定观测指标/外显变量
-
假设只存在一个类别,逐步增加类别个数
-
进行模型比较,确定最佳类别个数
-
对类别进行命名
Mplus语句
TITLE: This is an example of an LCA;
DATA: FILE IS dataLCA.dat; ! 数据文件名为dataLCA.dat
VARIABLE: NAME ARE A1-A5; ! 数据文件中的变量
USEVARIABLES ARE A1-A5; ! 使用的变量
MISSING ARE ALL (99); ! 定义缺失值为999
CLASSES = C(3); ! 设置类别个数,从1个类别开始,依次增加
CATEGORICAL = A1-A5; ! 定义A1-A5为类别变量
ANALYSIS: TYPE = MIXTURE;
STARTS = 200 50; ! 避免局部最大化解,增加随机起始值数
PROCESSOR = 4; ! 调用的处理器
OUTPUT: TECH11 TECH14; ! TECH11报告LMRT结果 TECH14报告BLRT结果
SAVEDATA: FILE = dataLCA.TXT; ! 保存个体分类结果到dataLCA.txt中
SAVE = CPROB; !保存后验分类概率
PLOT: TYPE IS PLOT3; ! 通过绘图命令,可以获得描述性统计图和条件概率示意图
SERIES = A1-A5 (*); ! 绘图中所使用的变量名
结果
1. 信息评价指标(AIC, BIC, aBIC)
2. Entropy指数
3. 似然比指标(LMR, BLRT)
4. 条件概率
条件概率:潜类别组内的个体在观测指标上的作答概率。
通过Plot>View plots,可查看条件概率图。
5. 分类结果
通过SAVEDATA将分类结果保存在dataLCA.txt中,语句运行后,会有一个名为dataLCA的txt文件,文件的最后一列便是分类结果,即每个个体属于哪一类。
6. 结果整理
可按照下图所示的图表整理上述结果。
(郑莹, 马皓苓, 2023)
(郑莹, 马皓苓, 2023)
LCA的后续分析
通过潜在类别分析,确定最佳类别个数后,可纳入协变量,分析协变量与潜在类别的关系。
以协变量为预测变量,以潜在类别为结果变量,进行Logistic回归。
(房立艳等, 2017)
(黄月胜等, 2019)
以协变量为结果变量,潜在类别变量为预测变量时,可以通过方差分析检验潜在类别之间的差异,或列联表分析协变量与潜在类别的关系。
(解登峰, 谢章明, 2017)
上述分析均为在Mplus中确定分类,采用其他统计分析软件,例如SPSS进行后续分析。初次之外,也可以直接在Mplus中进行后续分析,当协变量为预测变量时,通过命令“AUXILIARY = X (R3STEP)”来设定;当协变量为连续结果变量时,推荐通过命令“AUXILIARY = Y (BCH)”来设定。
Mplus语句
协变量为预测变量
TITLE: This is an example of an LCA;
DATA: FILE IS dataLCA.dat;
VARIABLE: NAME ARE A1-A5 X Y;
USEVARIABLES ARE A1-A5 X;
MISSING ARE ALL (99);
CLASSES = C(3);
CATEGORICAL = A1-A5;
AUXILIARY = X (R3STEP); ! 协变量为预测变量
ANALYSIS: TYPE = MIXTURE;
STARTS = 200 50;
PROCESSOR = 4;
OUTPUT: TECH11 TECH14;
SAVEDATA: FILE = dataLCA.TXT;
SAVE = CPROB;
PLOT: TYPE IS PLOT3;
SERIES = A1-A5 (*);
协变量为结果变量
TITLE: This is an example of an LCA;
DATA: FILE IS dataLCA.dat;
VARIABLE: NAME ARE A1-A5 X Y;
USEVARIABLES ARE A1-A5 Y;
MISSING ARE ALL (99);
CLASSES = C(3);
CATEGORICAL = A1-A5;
AUXILIARY = Y (BCH); ! 协变量为连续结果变量
ANALYSIS: TYPE = MIXTURE;
STARTS = 200 50;
PROCESSOR = 4;
OUTPUT: TECH11 TECH14;
SAVEDATA: FILE = dataLCA.TXT;
SAVE = CPROB;
PLOT: TYPE IS PLOT3;
SERIES = A1-A5 (*);
参考文献
房立艳, 张大均, 武丽丽, 胡天强. (2017). 中学生心理素质的类别特征:基于个体中心的潜在类别分析. 心理与行为研究, 15(01), 20-25
黄月胜, 范兴华, 刘妍, 向萍. (2019). 农村留守儿童情绪与行为问题的潜在类别及其家庭动因. 湖南第一师范学院学报, 19(05), 47-52
解登峰, 谢章明. (2017). 潜在类别分析在大学生网络情绪调节分类中的应用. 中国心理卫生杂志, 31(03), 252-256
郑莹, 马皓苓. (2023). 亲子关系对青少年偏差行为的影响——CEPS数据的潜在类别分析. 教育科学探索, 41(4), 82-90
希望上述介绍可以帮助到你!也欢迎大家在评论区多多交流分享。
你的关注/点赞 /收藏★/分享,是最大的支持!
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)