基于特征重要度二次筛选的DDoS攻击随机森林检测方法
特征选择是攻击检测算法中的一种重要方法,该方法多采用交叉验证递归特征消除(Recursive Feature Elimination with Cross-Validation,RFECV)技术,并通常结合机器学习算法使用.但该算法多用于选取单模型特征,其性能也极易受特征量、学习器的变化而波动,因其计算量大,该算法的分类准确率也仍需提高.针对上述问题,文中提出了一种基于特征重要度二次筛选的DDoS攻击随机森林检测方法.首先,该算法对原始数据集进行预处理并提取特征;其次,该算法为了从所选模型中选择最相关的变量,使用RF变量重要度准则,利用随机森林的重要性评分对变量进行排序;然后,在随机森林特征排序的基础上,对变量计算累积重要性并得到最重要变量;接着,使用所筛选出的最重要变量再次进行训练以生成分类模型,从而得出一组新的重要变量并将其定义为当前变量;最后,通过重要度准则,计算累积重要性来得到最终的最佳变量,从而有效地去除异常点,避免局部最优,进而实现对DDOS攻击的精准分类检测.实验结果表明,该方法具有较高的准确度和精确度,能够实现对正常流量以及各种DDoS攻击流量的精准分类,适用于在大数据下检测DDoS攻击.
DDoS攻击检测、特征提取、重要度准则、机器学习、随机森林
48
TP309.2(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;上海市科委科技创新行动计划;工程技术研究中心项目;实验室开放基金;国家重点实验室基金
2021-07-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
464-467,476