10.3969/j.issn.1001-3695.2014.07.017
基于权重差异和类别关联的互信息改进研究
作为文本分类中常用的特征选择方法,互信息在进行特征权重计算时,未考虑特征的正、负相关性及其影响程度的不同,同时也忽略了特征在类别中的分布情况.针对以上不足,通过分别引入权重差异因子和类别关联因子进行互信息模型的改进研究,优化特征词的权重区分度,加强特征与类别的联系.实验结果表明,改进后的互信息特征选择方法优化了特征权重的计算,显著提高了分类效果,从而证明了改进的互信息特征选择方法的有效性.
特征选择、互信息、权重差异、类别关联
31
TP391(计算技术、计算机技术)
国家高技术研究发展计划资助项目2012AA101608
2014-09-01(万方平台首次上网日期,不代表论文的发表时间)
共3页
1998-2000