10.16208/j.issn1000-7024.2021.10.007
基于主辅特征和深度学习的钓鱼网页检测方法
为提升钓鱼网页检测的准确率和效率,提出基于主辅特征的混合式深度学习模型.从URL、HTML页面内容和文档对象模型(document object model,DOM)结构中提取39种特征来表示钓鱼网页的多样性,其中包括两种新特征,基于信息增益将这39种特征根据重要程度分为主要特征和辅助特征;将两种特征向量通过不同通道分别送入由卷积神经网络和双向长短时记忆网络组成的混合式深度学习网络进行训练,对两通道的输出进行加权融合实现分类.实验结果表明,所提模型能有效地检测钓鱼网页.
钓鱼网页;主辅特征;深度学习;双通道;加权融合
42
TP393(计算技术、计算机技术)
陕西省自然科学基础研究计划基金项目2020JM-533
2021-11-02(万方平台首次上网日期,不代表论文的发表时间)
共7页
2748-2754