10.3969/j.issn.1003-0077.2009.06.009
基于词共现模型的垃圾邮件过滤方法研究
垃圾邮件过滤就是对邮件做出是垃圾或非垃圾的判断.传统的表示邮件的方法是在向量空间模型基础上通过信息增益等特征选择方法提取一部分词来表示邮件内容,存在语义信息不足的问题.该文提出一种将传统方法和词共现模型结合起来表示邮件特征的新方法,再采用交叉覆盖算法对邮件进行分类得到邮件分类器.实验表明,该文提出的邮件过滤算法与传统方法相比提高了过滤性能,词共现选择的维度要比传统方法选择的维度更具有代表性.
计算机应用、中文信息处理、向量空间模型、垃圾邮件过滤、词共现模型、交叉覆盖算法
23
TP391(计算技术、计算机技术)
国家重点基础研究973计划资助项目2004CB318108, 2007CB311003;国家自然科学基金资助项目60675031;教育部社科研究基金青年资助项目07JC870006
2010-01-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
61-66,71