场景图谱驱动目标搜索的多智能体强化学习
针对强化学习在视觉语义导航任务中准确率低,导航效率不高,容错率太差,且部分只适用于单智能体等问题,提出一种基于场景先验的多智能体目标搜索算法.该算法利用强化学习,将单智能体系统拓展到多智能体系统上将场景图谱作为先验知识辅助智能体团队进行视觉探索,利用集中式训练分布式探索的多智能体强化学习的方法以大幅度提升智能体团队的准确率和工作效率.通过在AI2THOR中进行训练测试,并与其他算法进行对比证明此方法无论在目标搜索的准确率还是效率上都优先于其他算法.
多智能体、强化学习、视觉语义导航、场景图谱、先验知识、分布式探索、集中式训练、目标搜索
18
TP391(计算技术、计算机技术)
国家自然科学基金U1613212
2023-03-03(万方平台首次上网日期,不代表论文的发表时间)
共9页
207-215