DOI：10.3969/j.issn.1673-629X.2008.11.008

覆盖算法下文本分类特征选择的研究

引用

摘要：

文本分类是信息检索和数据挖掘的基础,被广泛应用于网络数据挖掘及搜索引擎等方面.首先对文本进行分词,对分词的结果分别使用x2统计量(CHI)方法与相关系数法(CC法)进行降维,并使用维数调节的思想进行特征提取.在得到特征集后,使用覆盖算法作为文本分类器进行学习.实验结果表明,通过结合相关系数法、覆盖算法以及维数调节方法,可实现一个效果较好的文本分类器.

关键词：文本分类、x2统计量、覆盖算法、特征选择

所属期刊栏目：18

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金60675031;"九七三"计划国家重点基础研究2004CB318108.2007BC311003

在线出版日期：2009-01-06（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：29-31

英文信息展示

期刊专题