10.3969/j.issn.1002-137X.2012.10.040
基于区域划分的kNN文本快速分类算法研究
kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中广泛应用.为提高其分类效率,提出一种基于区域划分的kNN文本快速分类算法.将训练样本集按空间分布情况划分成若干区域,根据测试样本与各区域之间的位置关系快速查找其k个最近邻,从而大大降低kNN算法的计算量.数学推理和实验结果均表明,该算法在确保kNN分类器准确率不变的前提下,显著提高了分类效率.
文本分类、kNN算法、聚类、k-均值算法
39
TP311(计算技术、计算机技术)
2013-01-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
182-186