POMDP模型在多机器人环境探测中的应用研究

引用

摘要：

为了提高多机器人环境探测的效率和精度,本文提供了一种基于部分可观马尔可夫决策过程(Partially observable markov decision process,POMDP)的路径规划方法来控制多个装有传感器的机器人实现对环境的协同探测.建立了多机器人环境探测系统的P OMDP模型,以信息熵作为回报函数,令机器人沿着信息熵最大的方向不断移动.机器人对环境的信念采用非参数的、基于样本的表示,并用贝叶斯滤波来更新机器人对环境的信念.在仿真试验中,对两种环境的CO浓度进行了探测,都得到了精确的测量结果.与传统的全覆盖路径规划的方法相比,该方法在效率和精度上都具有优势.

关键词：多机器人、环境探测、POMDP、贝叶斯滤波、路径规划

所属期刊栏目：41

分类号：TP242(自动化技术及设备)

资助基金：国家自然科学基金51205277

在线出版日期：2022-04-01（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：178-185

英文信息展示

期刊专题