10.16208/j.issn1000-7024.2019.05.026
变精度粗糙集的加权KNN文本分类算法
针对训练样本较大时KNN算法(K最近邻算法)的分类效率较低和训练样本不均衡时算法的分类性能受到影响这两个问题,提出变精度粗糙集的加权KNN文本分类算法.利用变精度粗糙集上下近似的概念,将各个类别的训练集分为β正区域和β边界域.分类过程中根据测试样本与样本中心的相似度,得到样本的归属区域.其中属于β正区域的样本可以直接判断其类剐,其它区域的样本用基于数量加权的KNN算法判断其类别.实验结果表明,该算法能有效提高分类的性能和效率.
K最近邻、文本分类、变精度粗糙集、上近似、下近似、数量加权
40
TP391.1(计算技术、计算机技术)
江西省研究生创新专项基金项目YC2017-S314
2019-08-02(万方平台首次上网日期,不代表论文的发表时间)
共5页
1339-1342,1364