10.3772/j.issn.1000-0135.2014.01.005
基于多维尺度模型的潜在主题可视化研究
数据库内容结构分析把共词分析方法应用于全文主题发现,但事先选定种子词和统计共现次数等步骤导致该方法会遗漏很多重要的词汇组合和潜在主题.本文提出使用词汇集聚理论作为潜在主题可视化的理论基础,跳过事先选定种子词和统计共现矩阵的步骤,把词条表示在转置的向量空间中,通过多维尺度模型(MDS)算法把词条在转置向量空间中的邻近关系投影到三维空间图上,通过词汇的空间聚类来发现和表示潜在主题;引入数据编码的方法来克服MDS可视空间容量的局限,并设计了邻近矩阵、质心邻近矩阵、属性叠加邻近矩阵及三个层次的方法流程.最后,成功地将三个层次的潜在主题可视化的方法流程应用于计算机应用服务业上市公司的风险识别.
潜在主题、可视化、多维尺度模型、数据编码
33
F83;F8
国家建设高水平大学公派研究生项目留金发[2011]3005;国家自然科学基金71173249
2014-03-05(万方平台首次上网日期,不代表论文的发表时间)
共10页
45-54