10.3321/j.issn:1002-8331.2005.10.042
邮件内容过滤的中文编码盲识别算法
邮件内容过滤是信息安全领域的重点课题.文章着重介绍了一种中文文本编码自动识别算法,可以对目前互联网通信所使用的各种常用中文编码(GB2312,GBK,BIG5,UNICODE)进行盲识别,基本解决乱码问题,从而降低邮件内容过滤系统的虚警和漏警率,提高其处理范围.
中文编码、邮件过滤、高频字符、GB2312 GBK BIG5 UNICODE UTF
41
TP3(计算技术、计算机技术)
国家高技术研究发展计划863计划2003AA142160;上海市科委资助项目035115015
2005-05-26(万方平台首次上网日期,不代表论文的发表时间)
共3页
131-133