10.16208/j.issn1000-7024.2015.07.022
基于RSSI的贝叶斯垃圾邮件过滤算法
针对现有贝叶斯算法应用于垃圾邮件过滤时,贝努利模型精度低、不能区分文本特征重要性、多项式模型计算量大、无关特征项浪费计算时间、对出现次数少的特征项反应敏感等缺点,提出 RSSI (remove similar and sensitive items)特征模型。通过计算并比较特征项出现的频率,去除无关和敏感特征项,减小运算量,增加正确率,减少过拟合。M atlab仿真结果表明,与现有的朴素贝叶斯算法(na?ve Bayes)和支持向量机(support vector machine ,SVM)等算法相比,RS‐SI算法能显著减少分类时间,降低合法邮件被误判的概率。
邮件分类、贝叶斯分类器、特征提取、多项式事件模型、过拟合
TP391.9(计算技术、计算机技术)
教育部高等学校博士学科点专项科研基金项目20114101110005
2015-08-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
1790-1793