10.3969/j.issn.1000-565X.2017.03.012
用于垃圾邮件识别的"词频-筛"混合特征选择方法
文中针对当下愈发泛滥的垃圾邮件,分别使用朴素贝叶斯分类和支持向量机分类法对当前日益泛滥的垃圾邮件进行识别、分类,将"词频-筛"混合特征选择方法应用于分类器模型中,以提高分类器的识别性能.同时,通过考虑更全面的分类概率情况,改进朴素贝叶斯分类模型,进一步提升朴素贝叶斯分类器的识别性能.最后通过实验得到了该垃圾邮件识别系统的准确率、召回率和F1值等分类识别性能指标.实验结果表明,"词频-筛"混合特征选择方法能有效提高垃圾邮件分类器的识别性能,而且使用成本敏感方法的分类输出调节模块也能大大降低分类器将正常邮件误判为垃圾邮件的概率,因此,文中设计的垃圾邮件识别系统具有较强的实用性,可以在实际工作、生活中使用.
垃圾邮件识别、混合特征选择方法、朴素贝叶斯、支持向量机
45
TP391.43(计算技术、计算机技术)
广东省自然科学基金资助项目2016A030310412;广东高校省级重点平台及科研项目-青年创新人才类项目2015KQNCX003;广州市科技计划重点实验室项目15180007;广州市科技计划项目201707010223 Supported by the Natural Science Foundation of Guangdong Province of China2016A030310412
2017-07-06(万方平台首次上网日期,不代表论文的发表时间)
共7页
82-88