10.3969/j.issn.1007-757X.2007.02.007
短文本数据的自动分类
本文以比较购物搜索中的商品数据自动分类为应用背景,探讨短文本数据的分类问题,比较了常用的文本分类(Text Categorization)算法的特点,在此基础上提出k-NN与NB相结合的多分类器方案,对于NB算法分类不可信的情况下改用k-NN算法进行再次分类,并充分利用NB的中间结果供k-NN剪枝时作参考.实验数据表明该方法在与NB相近的时间复杂度下可明显地提高短文本分类的正确率和召回率,达到实际应用的要求.
文本分类、短文本、朴素贝页斯K、近邻
23
F724.6(中国国内贸易经济)
2007-04-09(万方平台首次上网日期,不代表论文的发表时间)
共3页
19-21