10.3969/j.issn.1002-137X.2011.01.045
聚类模式下一种优化的K-means文本特征选择
文本特征降维是文本自动分类的核心技术.K-means方法是一种常用的基于划分的方法.针对该算法对类中心初始值及孤立点过于敏感的问题,提出了一种改进的K-means算法用于文本特征选择.通过优化初始类中心的选择模式及对孤立点的剔除,改善了文本特征聚类的效果.随后的文本分类试验表明,提出的改进K-means算法具有较好的特征选择能力,文本分类的效率较高.
特征选择、聚类、K均值、文本分类
38
TP391(计算技术、计算机技术)
国家自然科学基金项目70571087
2011-04-29(万方平台首次上网日期,不代表论文的发表时间)
共3页
195-197