10.3969/j.issn.1673-629X.2009.02.032
一种文本特征选择方法的研究
在文本分类中,对高维的特征集进行降维是非常重要的,不但可以提高分类精度和效率,也可以找出富含信息的特征子集.而特征选择是有效降低特征向量维数的一种方法.目前常用的一些特征选择算法仅仅考虑了特征词与类别间的相关性,而忽略了特征词与特征词之间的相关性,从而存在特征冗余,影响了分类效果.为此,在分析了常用的一些特征选择算法之后,提出了一种基于mRMR模型的特征选择方法.实验表明,该特征选择方法有助于提高分类性能.
文本特征、文本分类、特征选择
19
TP311(计算技术、计算机技术)
福建省B类科技发展基金JB06023;中科院软件所开放课题基金SYSKF0701;福州大学科技发展基金2005-XQ-13,XRC-0511
2009-04-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
112-115