10.3969/j.issn.1673-4785.201301012
一种基于情感的中文微博话题检测方法
针对微博这种特殊的文本形式的话题检测,传统的算法并不能取得很好的效果。为了提高其查全率,根据微博这种带有结构化特点的信息,提出了一种带有情感内容加权的话题检测方法。该方法基于含有负面情感的词语往往携带了更多的信息量这一论点,在现有短文本话题检测的算法中,通过加大含有负面情感的短文本在话题检测中的权重,之后再根据一种基于自查询的聚类方法进行话题聚类,将情感倾向融合到短文本话题检测中。在真实数据集上的实验表明,此方法能有效地进行话题聚类并检测话题,并提高了查全率。
中文微博、话题检测、聚类、情感
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60970061,61075056,61103067;中央高校基本科研业务费专项资金资助项目基于云计算的高效数据挖掘算法研究.
2013-07-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
208-213