10.3969/j.issn.1003-3254.2012.07.040
基于集成学习理论的文本情感分类
随着Web2.0的迅速发展,越来越多的用户乐于在互联网上分享自己的观点或体验.这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信息的收集和处理,因此基于计算机的文本情感分类技术应运而生,并且研究的重点之一就是提高分类的精度.由于集成学习理论是提高分类精度的一种有效途径,并且已在许多领域显示出其优于单个分类器的良好性能,为此,提出基于集成学习理论的文本情感分类方法.实验结果显示三种常用的集成学习方法Bagging、Boosting和Random Subspace对基础分类器的分类精度都有提高,并且在不同的基础分类器条件下,Random Subspace方法较Bagging和Boosting方法在统计意义上更优,以上结果进一步验证了集成学习理论在文本情感分类中应用的有效性.
文本情感分类、集成学习、Bagging、Boosting、Random Subspace
21
G63;TP3
国家自然科学基金71101042;高等学校博士学科点专项科研基金20110111120014;中国博士后科学基金2011M501041;合肥工业大学博士学位专项资助基金2010HGBZ06077
2012-10-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
177-181,248