10.3969/j.issn.1002-137X.2012.04.041
基于相关性和冗余度的联合特征选择方法
比较研究了与类别信息无关的文档频率和与类别信息有关的信息增益、互信息和X2统计特征选择方法,在此基础上分析了以往直接组合这两类特征选择方法的弊端,并提出基于相关性和冗余度的联合特征选择算法.该算法将文档频率方法分别与信息增益、互信息和X2统计方法联合进行特征选择,旨在删除冗余特征,并保留有利于分类的特征,从而提高文本情感分类效果.实验结果表明,该联合特征选择方法具有较好的性能,并且能够有效降低特征维数.
文本情感分类、联合特征选择、相关性、冗余特征
39
TP391(计算技术、计算机技术)
国家自然科学基金60903225;国防科技大学优秀研究生创新基金S100502
2012-07-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
181-184