10.3321/j.issn:1000-565X.2004.z1.019
基于k-近邻方法的渐进式中文文本分类技术
针对k-近邻方法分类准确率较高、但分类效率较低的特性,提出了一种基于k近邻方法的渐进式中文文本分类技术,利用文本的标题、摘要、关键词、重点段落进行渐进式的分类处理.这样,不用分析全文就能将部分待分类文本成功分类,从而提高了文本分类的效率.实验结果表明,该方法在保证分类准确率的基础上能够有效地提高分类效率.
k-近邻方法、渐进式方法、中文文本分类
32
TP391(计算技术、计算机技术)
河北省自然科学基金200400129
2004-12-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
88-91