10.3969/j.issn.1672-9722.2009.11.004
基于文本和类别信息的KNN文本分类算法
提出了一种基于文本和类别信息的改进KNN文本分类算法.传统的KNN算法在计算样本相似度时利用的是文本和特征的相关信息,因此存在计算量大的明显缺陷,使其在具有大量高维样本的文本分类中缺乏实用性.新算法利用文本和类别的相关信息计算样本间的相似度,能够对特征维数进行有效的压缩.实验表明,该算法有较高的文本分类效率.
文本分类、K近邻法、特征降维、类别分布
37
TP391(计算技术、计算机技术)
河南省科技攻关项目0324220024
2010-01-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
10-12,49