10.3969/j.issn.1006-2475.2011.05.043
基于朴素贝叶斯的中文海事文本多分类器研究
设计一个有效地基于朴素贝叶斯的中文海事文本多分类器.在文本分类的预处理步骤中,在中文分词上选取领域词典和停用词典有效地降低特征维数、选取IG特征提取方法、改进的TF-IDF公式中特征词权重的计算方法,以建立词频矩阵等,最后用选取的海事样本数据进行训练建立分类库.实验数据表明,本文的基于朴素贝叶斯的中文海事文本多分类器具有很好的高效性和准确性.
海事、文本分类、朴素贝叶斯、多分类
TP391(计算技术、计算机技术)
2011-08-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
150-153