10.3969/j.issn.1002-1965.2013.02.008
基于中文短信文本聚类的热点事件发现
随着通信事业的快速发展,短信文本信息量非常巨大,乃至亿级,同时大类别短信文本中隐含着热点事件.现有聚类算法对海量短信文本进行聚类分析显得力不从心.利用短信文本在给定时间段中的内聚性,对待聚类的短信文本进行排序,并在聚类过程中清除孤立信息和小类别短信文本.实验表明,对于海量短信文本的大类别聚类效率是非常高的.
大类别、短信文本、聚类方法、热点事件
TP391(计算技术、计算机技术)
2013-03-28(万方平台首次上网日期,不代表论文的发表时间)
30-33