10.16208/j.issn1000-7024.2019.12.025
结合语义相似度改进LDA的文本主题分析
为对评论文本进行准确的主题分类,提出一种结合HowNet语义相似度和隐含狄利克雷分配(LDA)模型的主题聚类方法.不同于传统LDA模型,该方法通过HowNet常识知识库计算输入单词与当前主题聚类中单词间的语义相似度,以此调整LDA模型中的超参数β.为不同的单词分配不同的β值,以此监督聚类过程,在主题分析中实现从语法到语义的转变.实验结果表明,该方法能够有效提高主题聚类的准确性.
评论短文本、主题分析、HowNet语义相似度、LDA模型、超参数β
40
TP391(计算技术、计算机技术)
国家自然科学基金民航联合基金重点项目U1233202/F01
2020-01-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
3514-3519