10.3969/j.issn.1673-923X.2014.08.024
基于高斯混合模型的林业信息文本分类算法
为解决传统林业信息文本分类算法准确率低和正确率分布不均匀的问题,提出了一种基于高斯混合模型的林业信息文本分类算法。在阐述高斯混合模型和EM算法的基础上,使用TF-IDF方法计算林业信息文本特征值,对构造的林业信息文本特征矩阵降维,结合Kmeans算法,通过训练得到各类林业信息文本所对应的高斯混合模型的参数,构造分类器进行精准与快速分类。实验结果表明,该算法与神经网络分类方法、贝叶斯、决策树等常用分类算法相比,该算法有较高的准确率和实用性,为林业信息文本的分类研究开拓了新思路。
林业信息、文本分类、高斯混合模型、参数估计
S711(林业基础科学)
国家948项目2011-4-04;中央高校基本科研业务费专项资金项目DL12CB02;黑龙江省教育厅科学技术研究项目12513016;黑龙江省博士后基金;黑龙江省自然科学基金项目F201347;哈尔滨市科技创新人才专项资金项目2013RFQXJ100
2014-08-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
114-119