10.3969/j.issn.1003-0077.2005.05.001
基于内容的垃圾邮件过滤技术综述
垃圾邮件问题日益严重,受到研究人员的广泛关注.基于内容的过滤是当前解决垃圾邮件问题的主流技术之一.目前基于内容的垃圾邮件过滤主要包括基于规则的方法和基于概率统计的方法.本文综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,并总结了目前使用的垃圾邮件过滤技术以及它们之间的对比实验,包括Ripper、决策树、Rough Set、Rocchio、Boosting、Bayes、kNN、SVM、Winnow等等.实验结果表明,Boosting、Flexible Bayes、SVM、Winnow方法是目前较好的垃圾邮件过滤方法,它们在评测语料上的结果已经达到很高水平,但是,要走向真正实用化,还有很多的工作要做.
计算机应用、中文信息处理、综述、垃圾邮件、反垃圾邮件、信息过滤、文本分类
19
TP391(计算技术、计算机技术)
国家重点基础研究发展计划973计划2004CB318109
2005-10-13(万方平台首次上网日期,不代表论文的发表时间)
共10页
1-10