10.3969/j.issn.1000-7024.2014.11.030
基于K-Medoids聚类的改进KNN文本分类算法
为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法.利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,对文本训练集进行裁剪,解决传统KNN算法在文本训练集过大时速度慢的问题.分析与实验结果表明,该裁剪方法能够合理有效地裁剪文本训练集,提高了KNN算法的运行效率和分类能力.
文本分类、隶属度、K最近邻、样本裁剪、K-Medoids聚类
35
TP391.1(计算技术、计算机技术)
广东省科技计划基金项目2011B020313015
2015-01-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
3864-3867,3937