10.3969/j.issn.1000-3428.2010.19.028
基于LDA模型的主题词抽取方法
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词.采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵.模型拟合基于快速Gibbs 抽样算法进行.实验结果表明,快速Gibbs 算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高.
LDA模型、Gibbs抽样、主题词抽取
36
TP301(计算技术、计算机技术)
长春工业大学博士基金资助项目2008A02
2010-12-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
81-83