10.3969/j.issn.1000-3428.2005.13.022
针对垃圾邮件的直接多关键词匹配算法
提出了一种直接扫描电子邮件内容的多关键词匹配算法.邮件文本多采用Base64编码,由于Base64编码是前后相关的,因此完成匹配需要特殊的处理.该文提出的算法在不进行Base64解码的情况下,直接对邮件内容进行扫描匹配;同时针对Base64的编码结果是32位整型数据流的性质,该算法以32位块进行匹配操作,从而获得了比8位块的匹配更高的效率.实验结果表明,该算法比"解码-再匹配"策略快,比直接检索原始文本方法也要快.
垃圾邮件、直接多关键词匹配、串匹配、Base64
31
TP18(自动化基础理论)
国家高技术研究发展计划863计划2002AA142110
2005-08-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
59-61