基于余弦测度的Web指纹识别算法的研究与改进
为了在Web指纹数据库中实现对Web指纹的准确识别,需要对Web指纹识别算法进行研究.采用当前识别算法对Web指纹数据库中的Web指纹进行识别时,识别的结果与实际结果之间存在误差、识别所用的时间较长,因此存在识别准确率低和识别效率低的问题.在余弦测度的基础上提出了一种Web指纹识别算法,在结构特征、静态文件、Cookie设计和关键字4个方面采用源码审计方法完成了对Web指纹的选取,建立了Web指纹数据库.首先提取Web指纹数据库中数据的特征,根据特征提取结果剔除Web指纹数据库中存在的异常数据;然后将余弦距离函数当作相似性度量函数,采用K-means算法对Web指纹数据库中的Web指纹进行聚类;最后根据聚类结果完成对Web指纹的识别.实验结果表明,所提方法可在较短的时间内准确地完成对Web指纹数据库中Web指纹的识别,具有识别准确率高和识别效率高的优点.
余弦测度、Web指纹、识别算法
46
TP391.41(计算技术、计算机技术)
江西省科技支撑项目20171BBH80005 ,江西省科技厅项目2000616078
2019-11-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
295-298