10.3969/j.issn.1000-0135.2003.03.010
多类多标签汉语文本自动分类的研究
本文提出了一种高效的汉语文本分类方法,并在实验中收到了良好的效果.由于汉语文本的特殊性,在训练前对训练文本进行自动分词和降维预处理.许多文本往往可能归到多个类,分类算法采用改进的Boosting算法.实验表明,在多类多标签的汉语文本特征提取和文档分类中,该算法收敛快、准确性高、综合效果较好.
多类多标签、分词、降维、弱假设、弱学习
22
G25(图书馆学、图书馆事业)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
306-309