10.3969/j.issn.1673-4785.2010.02.013
改进词频分类器集成的文本分类算法
互联网容纳了海量的文本信息,文本分类系统能够在给定的类别下,自动将文本分门别类,更好地帮助人们挖掘有用信息.介绍了基于词频分类器集成文本分类算法.该算法计算代价小,分类召回率高,但准确率较低,分析了导致准确率低的原因,在此基础上提出了基于改进词频分类器集成的文本分类算法,改进后的算法在文本权重更新方面做了参数调整,使得算法的准确率有显著提高,最后用实验验证了改进后算法的性能.实验结果表明,基于改进词频分类器集成的文本分类算法不仅提高了分类的准确性,而且表现出较好的稳定性.
文本分类、集成学习、词频分类器、AdaBoost
5
TP18(自动化基础理论)
辽宁省教育厅基金资助项目05L090;大连市青年基金资助项目2005J22JH038;大连水产学院博士启动基金资助项目sybs200712
2010-06-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
177-180