基于聚类降维的改进KNN文本分类

引用

摘要：

特征向量的高维性以及训练样本分布不均影响文本分类器性能.提出了一种聚类模式下的KNN改进方法.首先使用一种改进的k-mean聚类方法对文本特征集进行初步筛选,随后使用一种基于类别的改进KNN分类器进行分类,减少了噪声样本对测试样本类别判定的干扰.试验结果表明本文提出的分类模型在分类效率上得到提高.

关键词：特征降维、聚类、文本分类、K平均、K近邻

所属期刊栏目：26

分类号：TP391(计算技术、计算机技术)

资助基金：项目名称:基于不完全语言信息的交互式群决策理论及应用资助;基金颁发部门:国家自然科学基金项目70571087

在线出版日期：2014-07-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：18-20

英文信息展示

期刊专题