10.3321/j.issn:1001-0505.2008.02.012
一种新的垃圾邮件样本采集方法
为了提高垃圾邮件样本的覆盖率和实时性,降低垃圾邮件过滤系统的计算复杂性和滞后性,提出了基于垃圾邮件发送的行为特征,采用蜜罐原理进行垃圾邮件样本采集.引入蜜罐帐户评价公式,根据这个公式设计并实现了蜜罐帐户选择算法,动态地在电子邮件服务器中选择一定数量的帐户作为蜜罐并生成蜜罐集合,定期从蜜罐集合中采集邮件样本,作为过滤系统的学习语料.实验表明,利用该方法能够使采集到垃圾邮件样本覆盖率达到98%以上.由于系统能够定期地进行样本采集,因此实时性较强,从而提高系统过滤垃圾邮件的能力.
垃圾邮件、过滤、样本采集、蜜罐帐户
38
TP393.08(计算技术、计算机技术)
国家自然科学基金90204009;江苏省高技术研究发展计划项目BG2004036
2008-05-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
244-248