Bagging中文文本分类器的改进方法研究
在文本分类研究中,集成学习是一种提高分类器性能的有效方法.Bagging算法是目前流行的一种集成学习算法.针对Bagging算法弱分类器具有相同权重问题,提出一种改进的Bagging算法.该方法通过对弱分类器分类结果进行可信度计算得到投票权重,应用于Attribute Bagging算法设计了一个中文文本自动分类器.采用kNN作为弱分类器基本模型对Sogou实验室提供的新闻集进行分类.实验表明该算法比Attribute Bagging有更好的分类精度.
中文文本分类、可信度、Attribute’Bagging
31
TP311(计算技术、计算机技术)
国家自然科学基金项目60736008
2010-04-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
281-284