10.3969/j.issn.1673-923X.2011.12.037
基于网络安全的网页过滤模型及其关键算法
识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域.在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出了基于同类词权重均值的关联过滤算法.最后,从两个角度进行算法评估,该过滤算法更为高效,并且能够很好的应对不良网站的反关键字过滤策略.
网页过滤、矩阵词典、权重均值
31
TP309(计算技术、计算机技术)
2012-05-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
197-201