10.3969/j.issn.1000-3428.2012.12.046
一种基于方差的文本特征选择算法
中文文本分类中传统特征选择算法在低维情况下分类效果不佳.为此,提出一种结合方差思想的评估函数,选出具有较强类别信息的词条,在保证整体分类性能不下降的同时,提高稀有类别的分类精度.采用中心向量分类器,在TanCorpV 1.0语料上进行实验,结果表明,该方法在低维空间优势明显,与常用的文档频率、信息增益等9种特征选择算法相比,宏平均值均有较大提高.
文本分类、特征选择、方差、类别信息、宏平均
38
TP312(计算技术、计算机技术)
2012-08-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
155-157,161