基于分层强化学习的智能化攻击路径发现方法
智能化攻击路径发现是开展自动化渗透测试的一项关键技术,但现有方法面临着状态、动作空间呈指数型增长和奖励稀疏等问题,导致算法难以收敛.为此,提出了一种基于分层强化学习的智能化攻击路径发现方法iPathD(Intelligent Path Dis-covery).iPathD将攻击路径发现过程构建为一个分层的马尔可夫决策过程,以分别描述上层的主机间渗透路径发现和下层的单主机内部攻击路径发现,并在此基础上提出并实现了一种基于分层强化学习的攻击路径发现算法.实验结果表明,与传统基于DQN(Deep Q Learning)及其改进算法的方法相比,iPathD路径发现方法更加快速有效,并且随着主机中漏洞数目的增加,iPathD的效果更好,且适用于大规模的网络场景.
渗透测试、马尔可夫决策过程、分层强化学习、攻击路径发现、DQN算法
50
TP393(计算技术、计算机技术)
国家自然科学基金62172432
2023-07-18(万方平台首次上网日期,不代表论文的发表时间)
共9页
308-316