10.13266/j.issn.0252-3116.2017.08.015
基于PhraseLDA模型的主题短语挖掘方法研究
[目的/意义]以主题短语识别为研究对象,提出基于PhraseLDA模型的主题短语挖掘方法,为快速理解文本内容、准确抽取文本主题提供借鉴思路.[方法/过程]对低频词进行量化定义,提出一种合理的短语重要度计算方法,最终利用PhraseLDA主题模型推理出主题短语.[结果/结论]实验结果表明该方法在多种数据集中挖掘出的主题短语质量较高,主题一致性较强.
主题模型、短语挖掘、主题短语
TP391(计算技术、计算机技术)
中国科学院“全院科技信息监测中心建设”项目院1628-4
2017-07-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
120-125