10.19678/j.issn.1000-3428.0056577
基于IMI-WNB算法的垃圾邮件过滤技术研究
互信息和朴素贝叶斯算法应用于垃圾邮件过滤时,存在特征冗余和独立性假设不成立的问题.为此,提出一种改进互信息的加权朴素贝叶斯算法.针对互信息效率较低的问题,通过引入词频因子与类间差异因子,提出一种改进的互信息特征选择算法,从而实现更高效的特征降维.针对朴素贝叶斯分类算法的独立性假设问题,在朴素贝叶斯分类时使用改进互信息值进行特征加权,消除部分朴素贝叶斯条件独立性假设对邮件分类的不利影响.实验结果表明,相比传统朴素贝叶斯算法,该算法提高了垃圾邮件过滤的精确度、召回率与稳定性.
互信息、垃圾邮件过滤、加权朴素贝叶斯算法、特征选择、词频
46
TP391(计算技术、计算机技术)
国家自然科学基金61300216
2021-02-04(万方平台首次上网日期,不代表论文的发表时间)
共7页
299-304,312