一种高效的用于话题检测的关键词元聚类方法
针对基于关键词元的话题内事件检测算法运行效率不高、不适合进行大规模文本话题检测的问题,提出了一种高效的关键词元聚类算法.该算法在进行词元簇选择时,为簇间相似度分配权值,并借鉴正态分布函数评估词元簇的个数,提高词元簇的选择精度,从而减少所需的词元聚类次数.实验结果表明,将改进的方法应用到舆情监控的话题检测中,能在不影响检测精度的前提下有效地提高算法的运行效率.
话题检测、关键词元、舆情监控
46
TP301(计算技术、计算机技术)
国家自然科学基金资助项目61172090;国家科技重大专项课题2012ZX03002001-004
2013-01-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
24-28