10.3969/j.issn.1007-130X.2012.09.029
一种基于朴素贝叶斯的微博情感分类
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取.构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类.主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法.并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因.实验结果表明,二次特征提取方法在分类上取得更高的F1.实验最佳的分类预处理方式是“表情符号十标点符号十二次情感特征提取+BOOL值”.同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的.
微博、文本情感分类、二次情感特征提取、朴素贝叶斯
34
TP393(计算技术、计算机技术)
国家社科基金资助项目12BYY045;教育部人文社会科学研究青年资助项目10YJCZH247;广东省科技计划资助项目2010B031000014;广东外语外贸大学研究生科研创新资助项目;广东外语外贸大学大学生创新实验资助项目
2012-11-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
160-165