10.16208/j.issn1000-7024.2017.05.026
融合HowNet和BTM模型的短文本聚类方法
针对常规技术对短文本聚类时出现的相似度计算准确度较差、聚类结果不稳定等问题,提出一种以HowNet语义词库和BTM主题建模为基础的相似度计算方法,将两者进行线性组合,综合考察短文本的相似性.建立基于聚类质量和聚类差异度的聚类结果评价指标,进行优劣评价,过滤出质量较好的结果,利用CSPA融合算法进行聚类融合.实验结果表明,该方法提高了短文本相似度计算的准确性,改进了融合结果稳定性.
短文本、知网、Biterm主题模型、聚类、融合
38
TP391.1(计算技术、计算机技术)
湖北省自然科学基金项目2014CFB356
2017-06-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
1258-1263