DOI：10.3969/j.issn.1006-9348.2011.01.057

GA-SVM算法在文本分类中的应用研究

引用

摘要：

文本特征维数通常高达几万且特征之间存在大量冗余和不相关信息,从而导致传统的分类方法效率低、分类准确率低.为了提高文本分类的快速性和准确性,提出了一种遗传算法(GA)和支持向量机(SVM)相结合的文本分类方法.把文本特征组合看作遗传算法中一个染色体,并进行二进制编码,将支持向量机分类准确率作为遗传算法的适应度函数,对每一个个体适应度的评价,通过选择、交叉和变异的遗传操作,得到文本最优特征,最后通过支持向量机利用最优特征进行分类.对复旦大学中文文本分类库进行仿真实验,实验结果表明,相对于传统的文本分类方法,能够快速地得到最优分类特征子集,大大提高文本分类的准确率,在文本挖掘中具有较好的应用前景.

关键词：文本分类、遗传算法、支持向量机、特征选择

所属期刊栏目：28

分类号：TP391(计算技术、计算机技术)

在线出版日期：2011-04-29（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：222-225

英文信息展示

期刊专题