基于聚类簇结构特性的自适应综合采样法在入侵检测中的应用
基于机器学习的网络入侵检测方法将恶意网络行为(入侵)检测转化为模式识别(分类)问题,因其适应性强、灵敏度高等优点,受到国内外广泛关注.然而,现有的模式分类器往往假设数据集的分布是均衡的,而真实的网络环境中,入侵行为要远少于正常访问,这给网络入侵行为检测带来巨大挑战.因此,提出一种基于聚类簇结构特性的综合采样法(CSbADASYN),通过挖掘少数类样本的内部结构对其进行自适应过采样,以获得样本分布结构特性保持的均衡数据样本,解决因数据不均衡带来的分类偏向.CSbADASYN先采用谱聚类方法对数据集中的少数类样本进行聚类分析,再根据所获得的聚类簇结构自适应插值,将获得样本分布结构保持的均衡样本用于分类器模型学习.在经典的NSL-KDD和KDD99数据集上进行大量的验证性和对比性实验,结果表明,CSbADASYN能使传统分类器模型在不均衡数据集上的分类性能得到明显提升.与传统的未经样本均衡处理和其他的带均衡处理的入侵检测方法相比,该方法能获得更低的误报率和漏报率.
网络入侵检测、不均衡数据处理、分布结构保持、谱聚类、自适应综合采样法、过采样
36
TP273(自动化技术及设备)
国家自然科学基金项目;湖南省自然科学基金项目;湖南省教育厅优秀青年项目;湖南省知识产权战略推进专项项目;湖南省研究生科研创新项目
2021-08-02(万方平台首次上网日期,不代表论文的发表时间)
共9页
1920-1928