10.3969/j.issn.2095-6835.2010.03.008
基于聚类降维的改进KNN文本分类
特征向量的高维性以及训练样本分布不均影响文本分类器性能.提出了一种聚类模式下的KNN改进方法.首先使用一种改进的k-mean聚类方法对文本特征集进行初步筛选,随后使用一种基于类别的改进KNN分类器进行分类,减少了噪声样本对测试样本类别判定的干扰.试验结果表明本文提出的分类模型在分类效率上得到提高.
特征降维、聚类、文本分类、K平均、K近邻
26
TP391(计算技术、计算机技术)
项目名称:基于不完全语言信息的交互式群决策理论及应用资助;基金颁发部门:国家自然科学基金项目70571087
2014-07-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
18-20