深度强化学习中稀疏奖励问题研究综述
强化学习作为机器学习的重要分支,是在与环境交互中寻找最优策略的一类方法.强化学习近年来与深度学习进行了广泛结合,形成了深度强化学习的研究领域.作为一种崭新的机器学习方法,深度强化学习同时具有感知复杂输入和求解最优策略的能力,可以应用于机器人控制等复杂决策问题.稀疏奖励问题是深度强化学习在解决任务中面临的核心问题,在实际应用中广泛存在.解决稀疏奖励问题有利于提升样本的利用效率,提高最优策略的水平,推动深度强化学习在实际任务中的广泛应用.文中首先对深度强化学习的核心算法进行阐述;然后介绍稀疏奖励问题的5种解决方案,包括奖励设计与学习、经验回放机制、探索与利用、多目标学习和辅助任务等;最后对相关研究工作进行总结和展望.
深度强化学习、深度学习、强化学习、稀疏奖励、人工智能
47
TP181(自动化基础理论)
国家自然科学基金61671175,61672190
2020-04-10(万方平台首次上网日期,不代表论文的发表时间)
共10页
182-191