10.3969/j.issn.1000-3428.2013.11.012
基于Hadoop的贝叶斯过滤MapReduce模型
传统分布式大型邮件系统对海量邮件的过滤存在编程难、效率低、前期训练耗用资源大等缺点,为此,对传统贝叶斯过滤算法进行并行化改进,利用云计算MapReduce模型在海量数据处理方面的优势,设计一种基于Hadoop开源云架构的贝叶斯邮件过滤MapReduce模型,优化邮件的训练和过滤过程。实验结果表明,与传统分布式计算模型相比,该模型在召回率、查准率和精确率方面性能较好,同时可降低邮件过滤成本,提高系统执行效率。
云计算、MapReduce模型、Hadoop架构、贝叶斯算法、垃圾邮件、反垃圾邮件过滤
TP338.6(计算技术、计算机技术)
国家“863”计划基金资助项目2009AA044601;国家自然科学基金资助重点项目61139002;南京航空航天大学基本科研业务费专项基金资助项目NS2010230
2013-12-10(万方平台首次上网日期,不代表论文的发表时间)
共5页
57-60,64