10.3969/j.issn.1007-757X.2012.02.017
一种x2统计-遗传算法的特征提取技术研究
特征提取技术是决定分类结果优良的主要因素,传统特征提取方法存在许多不足,诸如,当类别和特征分布高度不平衡时,不能有效地处理低频词;对于单个特征的处理不当,导致局部最优解的产生.针对特征提取技术中的问题,提出基于x2统计-遗传算法的特征提取算法,此方法将词条的x2统计值引入到特征向量中,将此类向量作为遗传算法的初始种群进行启发式搜索,与此同时,针对特征提取的性质,提出新的适应度函数和交叉规则.实验表明,基于x2统计-遗传算法的特征提取算法能选择出准确表征文本类别的特征项,将其运用到文本分类系统中能有效地提高文本分类的准确率.
文本分类、特征提取、统计方法、遗传算法
28
TP391(计算技术、计算机技术)
中央高校基本科研业务费专项资金资助项目10CX01003A
2012-05-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
55-58