10.3969/j.issn.1006-2475.2011.07.047
文本特征选择算法MI的改进
特征选择在文本挖掘技术中是一个关键部分.训练集中的文本逐个经过分词后,可形成文本分类系统的全特征空间,一般情况下,这个空间的维数都会较大,可达到几十万维.经过特征选择之后,在降低噪声的同时,特征空间的维数得以压缩,最终能提高分类算法的速度和分类精度.本文从传统的Ml(Mutual Infomation)出发,并对它进行改造,最后通过实验验证改进算法的有效性.
特征选择、MI、IG、标准差
TP311(计算技术、计算机技术)
2012-01-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
172-175