基于深度强化学习的组合优化研究进展
组合优化问题广泛存在于国防、交通、工业、生活等各个领域,几十年来,传统运筹优化方法是解决组合优化问题的主要手段,但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高,传统运筹优化算法面临着很大的计算压力,很难实现组合优化问题的在线求解.近年来随着深度学习技术的迅猛发展,深度强化学习在围棋、机器人等领域的瞩目成果显示了其强大的学习能力与序贯决策能力.鉴于此,近年来涌现出了多个利用深度强化学习方法解决组合优化问题的新方法,具有求解速度快、模型泛化能力强的优势,为组合优化问题的求解提供了一种全新的思路.因此本文总结回顾近些年利用深度强化学习方法解决组合优化问题的相关理论方法与应用研究,对其基本原理、相关方法、应用研究进行总结和综述,并指出未来该方向亟待解决的若干问题.
深度强化学习;组合优化问题;深度神经网络;图神经网络;指针网络
47
国家自然科学基金面上项目;湖湘青年英才计划;科技委国防创新特区项目;国防科技大学自主科研计划
2021-12-15(万方平台首次上网日期,不代表论文的发表时间)
共17页
2521-2537