10.3969/j.issn.1006-2475.2022.06.019
一种基于改进TF-IDF的SQL注入攻击检测算法
由于传统的TF-IDF算法没有很好地分配特征词的权重,从而会出现特征提取不充分并且效率低等问题,导致结果不符合实际情况.为了解决该方法在SQL注入攻击检测时所产生的局限性,本文通过在传统的TF-IDF算法里面加入文本数量比因子和卡方统计量CHI来改进TF-IDF,能够很好地改善一些重要词汇的权重问题.通过选择不同的分类器实现SQL注入攻击的检测,从而获得不同的分类结果.实验结果表明,Boosted Decision Tree和改进的TF-IDF相结合的方法与其它同类方法相比,具有更高的准确率、召回率和F1值.此外,本文算法相较于传统的TF-IDF算法对SQL注入攻击检测的正确率、准确率、召回率、F1值均提高5%左右,具有一定的实际应用前景.
SQL注入、TF-IDF、卡方统计量、文本向量化
TP391(计算技术、计算机技术)
辽宁省教育厅高等学校基本科研项目LJKZ0434
2022-06-29(万方平台首次上网日期,不代表论文的发表时间)
共5页
122-126