10.3969/j.issn.1001-3695.2012.04.028
基于方差的CHI特征选择方法
通过分析特征词与类别间的相关性,在原有的卡方特征选择的方法上增加三个调节参数,使选出的特征词集中分布在某一类,且在某一类中尽可能地均匀分布,并使特征词在某一类中出现的次数尽可能地多.通过实验对比改进前后的卡方特征选择方法,基于方差的卡方统计(Var-CHI)方法使得查全率和查准率都得到了明显的提高.
文本分类、特征选择、卡方统计量、方差
29
TP391(计算技术、计算机技术)
国家自然科学基金资助项目70971059;辽宁省创新团队资助项目2009T045
2012-06-26(万方平台首次上网日期,不代表论文的发表时间)
共3页
1304-1306