短文本流突发性话题发现:BBTM改进算法
BBTM模型克服了数据稀疏性和冗余性,是短文本流突发性话题发现的有效方法.然而,BBTM模型量化词对突发概率方法比较简陋且存在不合理性,对周期性话题关联词对的突发概率估计有偏差,故提出了一种结合基于自动状态机的枚举突发词对和正态分布的改进方法.实验证明,该方法能够为模型建模提供更准确的先验知识,从而提高模型对突发话题的敏感度和话题抽取的准确度.
短文本、突发性、BBTM、枚举突发、正态分布
13
TP181(自动化基础理论)
2017-05-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
248-250