10.3969/j.issn.1000-3428.2009.20.029
基于质心的文本分类算法
当文本集较分散或出现多峰值时,基于质心的文本分类算法分类效果很差.针对该问题提出一种改进的文本分类算法,与基于质心的经典分类算法相比,其性能较高.在香港慧科讯业公司提供的文本分类语料库上的测试结果表明,该算法的效率和精度满足要求.
文本分类、质心、K近邻
35
TP18(自动化基础理论)
河南省教育厅自然科学基金资助项目2007520050;郑州大学-香港慧科讯业有限公司合作基金
2009-12-04(万方平台首次上网日期,不代表论文的发表时间)
共3页
83-85