10.16208/j.issn1000-7024.2020.09.019
融合语义特征的加权朴素贝叶斯分类算法
针对传统朴素贝叶斯算法属性独立性假设降低分类效果的问题,提出一种融合语义特征的加权朴素贝叶斯算法.在特征提取时引入Google距离衡量词语间语义相关性对节点权值进行重新计算;利用改进的NGD-TextRank算法提取数据集中关键特征,去除冗余属性进行降维;在分类过程中对不同特征项的影响程度进行划分,将特征项的权值融合到朴素贝叶斯公式中构造加权朴素贝叶斯分类算法.为验证算法性能,使用多类型数据集设计实验,与同类算法对比分析结果表明,该算法能够有效提取关键特征,经过加权处理后较好提高了文本分类的准确性.
Google距离、TextRank、Hellinger距离、权值优化、朴素贝叶斯
41
TP391.1(计算技术、计算机技术)
吉林省科技发展计划技术攻关基金项目20190302118GX
2020-10-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
2523-2529