10.3979/j.issn.1673-825X.2018.04.019
基于属性降维的钓鱼网站检测方法
随着对钓鱼网站分析刻画的不断完善,使得钓鱼网站检测特征呈现高维化特点.属性维度的增加以及数据量的增长,会造成检测计算复杂度呈几何倍数扩大,导致检测时间复杂度高、占用资源大和检测效率低.针对多属性的钓鱼网站检测,设计了一种基于属性降维的钓鱼网站检测方法.该方法使用信息增益方法对原始数据进行特征选择,筛除可能存在的冗余和噪声数据信息;根据不同属性间的互信息计算属性相关性矩阵,利用属性相关性矩阵作为权值参与加权主成分分析;根据得到的降维后新特征数据通过监督学习算法构建钓鱼网站检测模型.实验表明,该方法可以有效降低原始数据中冗余和噪声属性的干扰,能够有效检测出复杂网络环境中的钓鱼网站,同时具有较高的稳定性.
多属性、降维、钓鱼网站、检测
30
TP393(计算技术、计算机技术)
国家自然科学基金61772099;中国博士后基金2014M562282;重庆市博士后项目XM2014039;重庆市人工智能技术创新重大主题专项cstc2017rgzn-zdyf0140;重庆市高校优秀成果转化资助KJZH17116
2018-12-17(万方平台首次上网日期,不代表论文的发表时间)
共8页
564-571