基于指数分布族的类特定文本分类算法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3979/j.issn.1673-825X.2019.05.015

基于指数分布族的类特定文本分类算法

引用
在文本分类中,选取一个高效的分类算法是提高文本分类准确度,缩短分类时间的关键.提出基于指数分布族的多项式贝叶斯类特定分类算法(exponential family-multinomial naive Bayes,EF-MNB),基于多项式模型构造了N个类的分布,利用类特定特征选择算法得到第N个类的特征子集及对应类的特征概率密度函数(probability den-sity function,PDF),通过指数分布族构造了N个类的原始PDF估计表达式,给定N个类的训练集,得到了第N个类的最优PDF估计,并基于贝叶斯定理制定了分类规则.仿真结果表明,与基于文档主题生成模型和支持向量机(latent dirichlet allocation-support vector machine,LDA-SVM)的层次分析分类算法、改进的超球支持向量机(improved hyper-sphere support vector machine,IHS-SVM)文本分类算法和基于主成份分析和k最近邻(principal component a-nalysis-k-nearest-neighbor,PCA-KNN)混合分类算法相比,EF-MNB类特定分类算法使用少量的时间就可获得更高分类准确率.

指数分布族、类特定特征选择、类条件概率密度函数、多项式朴素贝叶斯分类器、文本分类

31

TP391(计算技术、计算机技术)

国家自然科学基金61262040

2019-11-22(万方平台首次上网日期,不代表论文的发表时间)

共8页

694-701

相关文献
评论
暂无封面信息
查看本期封面目录

重庆邮电大学学报(自然科学版)

1673-825X

50-1181/N

31

2019,31(5)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn