10.3969/j.issn.1671-1122.2021.12.016
基于加权Stacking集成学习的Tor匿名流量识别方法
Tor网络常被犯罪分子用来从事各类违法活动,因此对Tor流量进行高效识别对网络监管和打击犯罪有着重要意义.文章针对真实环境中Tor流量稀疏及识别准确率不高的问题,基于集成学习思想,提出一种加权Stacking模型的Tor流量识别方法.基于数据流层面提取流量的时间相关性特征,文章计算信息增益筛选最大的前14个特征构成输入数据集,对KNN、SVM和XGBoost进行不同的加权改进并作基学习器,XGBoost作为元学习器构建两层Stacking模型.在公开数据集上与10种其他算法对比,实验结果表明,文章提出的识别模型在准确率上优于大部分算法并且拥有较低的漏报率,更符合真实网络环境中Tor流量识别的要求.
匿名网络;Tor;不平衡数据;Stacking
TP309(计算技术、计算机技术)
中国人民公安大学基科费新型犯罪专项2021XXFZ003
2022-01-19(万方平台首次上网日期,不代表论文的发表时间)
共8页
118-125