10.11772/j.issn.1001-9081.2014.11.3279
基于词频信息的改进信息增益文本特征选择算法
为克服传统信息增益(IG)算法对特征项的频数考虑不足的缺陷,在对传统算法和相关改进算法深入分析的基础上,提出一种基于词频信息的改进的IG文本特征选择算法.分别从特征项在类内出现的频数、类内位置分布、不同类间的分布等方面对传统IG算法的参数进行了修正,使特征频数信息得到充分利用.对文本分类的实验结果表明,所提算法的分类精度明显高于传统IG算法和加权的IG改进算法.
文本分类、特征选择、信息增益、词频、参数修正
34
TP391.1(计算技术、计算机技术)
国家自然科学基金资助项目61272244
2015-01-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
3279-3282