事件驱动的强化学习多智能体编队控制
针对经典强化学习的多智能体编队存在通信和计算资源消耗大的问题,本文引入事件驱动控制机制,智能体的动作决策无须按固定周期进行,而依赖于事件驱动条件更新智能体动作.在设计事件驱动条件时,不仅考虑智能体的累积奖赏值,还引入智能体与邻居奖赏值的偏差,智能体间通过交互来寻求最优联合策略实现编队.数值仿真结果表明,基于事件驱动的强化学习多智能体编队控制算法,在保证系统性能的情况下,能有效降低多智能体的动作决策频率和资源消耗.
强化学习、多智能体、事件驱动、编队控制、马尔可夫过程、集群智能、动作决策、粒子群算法
14
TP391.8(计算技术、计算机技术)
国家重点研发计划项目2017YFB1400800;国家自然科学基金项目91648120,61633002,51575005,61563006,61563005;广西高校工业过程智能控制技术重点实验室项目IPICT-2016-04
2019-03-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
93-98