基于Hadoop平台的电子邮件分类
为了从大量的电子邮件中检测垃圾邮件,提出了一个基于Hadoop平台的电子邮件分类方法。不同于传统的基于内容的垃圾邮件检测,通过在MapReduce框架上统计分析邮件收发记录,提取邮件账号的行为特征。然后使用MapReduce框架并行的实现随机森林分类器,并基于带有行为特征的样本训练分类器和分类邮件。实验结果表明,基于Hadoop平台的电子邮件分类方法大大提高了大规模电子邮件的分类效率。
Hadoop、MapReduce、大规模、垃圾邮件、分类
TP311(计算技术、计算机技术)
国家自然科学基金61171132;南通市应用研究计划项目BK2012034
2015-01-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
8119-8121