基于机器学习的网页暗链检测方法
在大数据时代下,传统暗链检测技术无法在海量网页中快速准确地识别出遭遇“暗链攻击”的网站.为此,提出一种引入机器学习的方法研究网页的暗链检测.该方法结合暗链的域名、相关文本及隐藏结构3种特征,分别采用分类与回归树、梯度提升决策树及随机森林3种算法来构建检测模型并对比其的性能.实验结果表明,该方法具有较高的准确性和可靠性,其中随机森林构建的检测模型分类准确率可以达到0.984.
暗链、特征提取、交叉验证、分类与回归树、随机森林、梯度提升决策树
44
TP309.5(计算技术、计算机技术)
国家自然科学基金重点项目61332010
2018-12-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
22-27