基于匈牙利匹配算法的钓鱼网页检测方法
如何快速有效地计算网页的相似性是发现钓鱼网页的关键.现有的钓鱼网页检测方法在检测效果上依然存在较大的提升空间.文中提出基于匈牙利匹配的钓鱼网页检测模型,该模型首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果.一系列的仿真实验表明文中方法可行,并具有较高的准确率和召回率.
钓鱼网页、网页特征、匈牙利匹配算法、相似性、网页签名
33
TP391(计算技术、计算机技术)
国家自然科学基金60703086,60873050,60803008,60973046、苏州大学江苏省计算机信息处理技术重点实验室基金KJS0714;江苏省高校自然科学研究计划09KJB520012
2011-01-27(万方平台首次上网日期,不代表论文的发表时间)
共13页
1963-1975