10.3969/j.issn.1001-3695.2011.06.027
基于线性组合文本特征选择方法
常用文本分类特征选择算法主要通过某种评价函数来计算单个特征对类别的区分能力,由于仅考虑了特征和类别之间的关联性,忽略了特征与特征之间的相关性,从而导致特征集存在冗余.针对这一问题,提出了一种新的用于文本分类的特征选择算法,该算法可以帮助选出类别区分能力强、特征之间关联性弱的特征.实验证实,该算法的性能要优于传统的特征选择算法.
文本分类、特征选择、模糊相关、冗余性
28
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目70971059;辽宁省创新团队资助项目2009T045;辽宁省科技攻关资助项目2007308003
2011-09-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
2099-2101