10.3778/j.issn.1002-8331.2010.26.038
优化的互信息特征选择方法
在文本分类中,互信息是一种被广泛应用的特征选择方法,但是该方法仅考虑了特征的文档频而没有考虑特征的词频,导致它经常倾向于选择出现频率较低的特征.为此,提出了一个新的文档频并把它引入到互信息方法中,从而获得了一种优化的互信息方法.该优化的互信息方法不但考虑了特征的文档频而且还考虑了特征出现的词频.实验结果表明该优化的互信息方法性能良好.
文本分类、互信息、特征选择、词频、文档频
46
TP301(计算技术、计算机技术)
四川省科技计划项目2008GZ0003;四川省科技攻关计划the Key Technologies R&D Program of Sichuan Province,China under Grant 07GG006-019
2010-11-30(万方平台首次上网日期,不代表论文的发表时间)
共3页
122-124