10.3969/j.issn.1002-137X.2008.02.022
基于信息熵和决策分类技术的邮件识别研究
本文通过对电子邮件头信息和正文内容进行离散和特征化处理,将一封电子邮件用向量组的方式加以表达;进而使用基于信息熵的决策树分类技术构建一种垃圾邮件分类识别模型;最后通过实验对该模型做了相关的检验和测试.实验证明,该模型经过一定数量的垃圾邮件和正常邮件的对比学习后,能够进行垃圾邮件的识别,具有较好的效果.
决策树、信息增益、数据挖掘、垃圾邮件
35
TP3(计算技术、计算机技术)
2008-05-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
87-89