基于稀疏主成分分析的非正式语词的心理-人格特征研究
针对社会媒体中非正式文本的数据分析经常出现的稀疏数据矩阵,在应用文本分析工具的基础上使用稀疏主成分分析这一特征,降维分析方法分析现实情况下聊天文本中非正式语词表现的认知语用特征、描述非正式语词与人格的关系.使用短文本主题模型、心理距离问卷、大五人格问卷测量人格和背景变量,使用计算机文本分析工具对被试提供的即时聊天文本内的语词计频,使用简体中文版语词查询与字词计数字典和认知语用学对稀疏主成分分析后非正式语词维度进行特征表征.在非正式语词降维上,稀疏主成分分析比主成分分析在因子载荷数上更稳定,在累积方差解释率上也相对更优(24.54%>23.40%);降维所得的6因子中“主观评价”与宜人性正相关(r0.05=.16,p=.03<0.05),“随意社交”与宜人性负相关(r0.05=-.16,p=.03<0.05),“认知愉悦”与性别显著正相关(r0.05=.43,p=.00<0.001).使用稀疏主成分分析对非正式语词的降维效果较好,并且比较简体中文版语词查询与字词计数字典的非正式语词维度和降维后所得非正式语词维度,两者在和人格的相关上是相符的,且后者能探索出更多信息.
文本分析、稀疏主成分分析、非正式语词
31
TP391(计算技术、计算机技术)
2017-04-17(万方平台首次上网日期,不代表论文的发表时间)
共13页
192-204