Bagging中文文本分类器的改进方法研究

引用

摘要：

在文本分类研究中,集成学习是一种提高分类器性能的有效方法.Bagging算法是目前流行的一种集成学习算法.针对Bagging算法弱分类器具有相同权重问题,提出一种改进的Bagging算法.该方法通过对弱分类器分类结果进行可信度计算得到投票权重,应用于Attribute Bagging算法设计了一个中文文本自动分类器.采用kNN作为弱分类器基本模型对Sogou实验室提供的新闻集进行分类.实验表明该算法比Attribute Bagging有更好的分类精度.

关键词：中文文本分类、可信度、Attribute’Bagging

所属期刊栏目：31

分类号：TP311(计算技术、计算机技术)

资助基金：国家自然科学基金项目60736008

在线出版日期：2010-04-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：281-284

英文信息展示

期刊专题