邮件过滤算法的比较
探讨了邮件过滤器的体系,介绍了6种常用的过滤算法.在4个公用的数据集上,利用3个评价指标对这6种算法进行了全面的比较.实验的主要结论有:集成过滤器的方法有利于提高过滤效果;与其它两个数据集相比,PU1和Ling-spam数据集用于评价过滤器时会得出相对乐观的结果;NB和k-NN的表现不稳定,对数据集的敏感程度较高.对于邮件过滤研究者了解、改进已有算法,提出新的算法有一定的参考价值.
邮件过滤、电子邮件、过滤体系、垃圾电子邮件、数据挖掘
29
TP302(计算技术、计算机技术)
河北省科技厅基金项目07213507D、06213558;石家庄经济学院重点基金项目Y200606
2008-11-24(万方平台首次上网日期,不代表论文的发表时间)
共4页
4433-4436