DOI：10.3969/j.issn.1003-3254.2012.07.040

基于集成学习理论的文本情感分类

引用

摘要：

随着Web2.0的迅速发展,越来越多的用户乐于在互联网上分享自己的观点或体验.这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信息的收集和处理,因此基于计算机的文本情感分类技术应运而生,并且研究的重点之一就是提高分类的精度.由于集成学习理论是提高分类精度的一种有效途径,并且已在许多领域显示出其优于单个分类器的良好性能,为此,提出基于集成学习理论的文本情感分类方法.实验结果显示三种常用的集成学习方法Bagging、Boosting和Random Subspace对基础分类器的分类精度都有提高,并且在不同的基础分类器条件下,Random Subspace方法较Bagging和Boosting方法在统计意义上更优,以上结果进一步验证了集成学习理论在文本情感分类中应用的有效性.

关键词：文本情感分类、集成学习、Bagging、Boosting、Random Subspace

所属期刊栏目：21

分类号：G63;TP3

资助基金：国家自然科学基金71101042;高等学校博士学科点专项科研基金20110111120014;中国博士后科学基金2011M501041;合肥工业大学博士学位专项资助基金2010HGBZ06077

在线出版日期：2012-10-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：177-181,248

英文信息展示

期刊专题