10.3969/j.issn.1673-629X.2008.11.008
覆盖算法下文本分类特征选择的研究
文本分类是信息检索和数据挖掘的基础,被广泛应用于网络数据挖掘及搜索引擎等方面.首先对文本进行分词,对分词的结果分别使用x2统计量(CHI)方法与相关系数法(CC法)进行降维,并使用维数调节的思想进行特征提取.在得到特征集后,使用覆盖算法作为文本分类器进行学习.实验结果表明,通过结合相关系数法、覆盖算法以及维数调节方法,可实现一个效果较好的文本分类器.
文本分类、x2统计量、覆盖算法、特征选择
18
TP18(自动化基础理论)
国家自然科学基金60675031;"九七三"计划国家重点基础研究2004CB318108.2007BC311003
2009-01-06(万方平台首次上网日期,不代表论文的发表时间)
共3页
29-31