10.3969/j.issn.1673-629X.2008.05.025
基于CHI值特征选取和覆盖的文本分类方法
利用CHI值特征选取和前向神经网络的覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类.该方法利用CHI值进行特征选取即特征降维,应用覆盖算法进行文本分类.该方法将CHI值特征选取和覆盖算法充分结合,在提高了分类速度的同时还保证了分类的准确度.应用该方法对标准数据集中的文本进行实验,并在不同的维数上与SVM算法、朴素贝叶斯方法的实验结果进行了比较.结果表明,与SVM算法和朴素贝叶斯方法相比较,覆盖算法在准确度上更好.并且,维数的选择对分类的精确度影响很大.
文本处理、覆盖算法、文本分类
18
TP301.6(计算技术、计算机技术)
国家自然科学基金60675031,60475017;安徽省教育厅重点自然科学研究项目2006KJ015A;安徽省教育厅自然科学研究项目2005kj053;安徽大学211工程学术创新团队;973计划国家重点基础研究2004CB318108
2008-07-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
79-81,85