模仿学习综述:传统与新进展

引用

摘要：

模仿学习是强化学习与监督学习的结合,目标是通过观察专家演示,学习专家策略,从而加速强化学习.通过引入任务相关的额外信息,模仿学习相较于强化学习,可以更快地实现策略优化,为缓解低样本效率问题提供了解决方案.模仿学习已成为解决强化学习问题的一种流行框架,涌现出多种提高学习性能的算法和技术.通过与图形图像学的最新研究成果相结合,模仿学习已经在游戏人工智能(artificial intelligence,AI)、机器人控制和自动驾驶等领域发挥了重要作用.本文围绕模仿学习的年度发展,从行为克隆、逆强化学习、对抗式模仿学习、基于观察量的模仿学习和跨领域模仿学习等多个角度进行深入探讨,介绍了模仿学习在实际应用上的最新情况,比较了国内外研究现状,并展望了该领域未来的发展方向.旨在为研究人员和从业人员提供模仿学习的最新进展,从而为开展工作提供参考与便利.

关键词：模仿学习(IL)、强化学习、基于观察量的模仿学习(ILfO)、跨领域模仿学习(CDIL)、模仿学习应用

所属期刊栏目：28

分类号：TP18(自动化基础理论)

在线出版日期：2023-07-27（万方平台首次上网日期，不代表论文的发表时间）

页数：共23页

页码：1585-1607

英文信息展示

期刊专题