10.3969/j.issn.1007-130X.2010.08.025
文本多分类中的特征选择研究
特征选择是数据挖掘和机器学习等领域内重要的预处理步骤,近年来得到了广泛的关注.文本数据的高维性往往会影响分类等数据挖掘任务的效率,因此特征选择常被作为文本分类过程中的重要组成部分,以达到降维的目的.随着分类技术的快速发展,类别的日益细化,文本的多类分类问题为特征选择方法提出了更多的挑战.本文面向文本多类分类的应用背景,阐述了目前特征选择方法所面临的主要挑战,给出了多分类特征选择方法的主要种类.本文沿着相关研究的发展路线,由易至难,由浅入深,通过对目前多分类特征选择算法的应用情况进行总结,并进行综述评论,最后对全文进行了概括,提出了未来可能的研究方向.
特征选择、文本分类、数据挖掘、层次结构
32
TP391(计算技术、计算机技术)
国家863计划资助项目2006AA01Z451,2007AA01Z474,2007AA010502;国家自然科学基金资助项目60873204;NCET060928
2010-11-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
90-93,148