基于集成学习的钓鱼网页深度检测系统
网络钓鱼是一种在线欺诈行为,它利用钓鱼网页仿冒正常合法的网页,窃取用户敏感信息从而达到非法目的.提出了基于集成学习的钓鱼网页深度检测方法,采用网页渲染来应对常见的页面伪装手段,提取渲染后网页的URL信息特征、链接信息特征以及页面文本特征,利用集成学习的方法,针对不同的特征信息构造并训练不同的基础分类器模型,最后利用分类集成策略综合多个基础分类器生成最终的结果.针对PhishTank钓鱼网页的检测实验表明,本文提出的检测方法具有较好的准确率与召回率.
钓鱼网页、集成学习、深度检测、特征提取
25
TP3;TP1
国家高技术研究计划8632015AA016006;国家自然科学基金61303248,U1536106;北京市自然科学基金4144089;信息网络安全公安部重点实验室开放课题C15604
2016-12-13(万方平台首次上网日期,不代表论文的发表时间)
共10页
47-56