10.3969/j.issn.1000-7024.2014.06.024
基于加权改进贝叶斯算法的维吾尔文文本分类
为了提高朴素贝叶斯分类器在维吾尔文本中的分类性能,在具体分析维吾尔文文字特性的基础上,对其进行向量化预处理,降低空间维度.考虑到特征项在集合中的具体分布情况,从特征项的区分度和代表性的角度出发,结合词频,提出了3个权重调整系数,对传统的权值函数TFIDF进行了改进,修正了不同特征词对分类的贡献度.在构建的维吾尔文语料库上进行实验,实验结果表明,与朴素贝叶斯算法相比,此算法具有更好的分类性能.
文本分类、维吾尔文、朴素贝叶斯、词频反文档频、权值调整
35
TP391.1(计算技术、计算机技术)
国家自然科学基金项目61163026、60865001
2014-07-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
1999-2003