10.3969/j.issn.1003-3254.2007.11.032
一种新的基于密度的k-最近邻文本分类器训练样本约减方法
本文针对k-最近邻方法分类效率不高的问题,提出了一种基于密度的训练样本集约减算法.该方法通过计算训练样本集中各类别的类别密度及整个训练集的平均密度,去掉高密度类别中的部分样本,使训练样本集具有更好的代表性.实验表明,该方法不仅提高了k-最近邻方法的分类效率,而且对其分类准确率也有一定程度的提高.
文本分类、k-最近邻方法、训练样本
TP3(计算技术、计算机技术)
2007-12-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
127-128,64