10.3969/j.issn.1001-0505.2012.S1.013
基于分布式纳什Q学习的多传感器协同目标跟踪
针对传统目标跟踪算法过分依赖环境模型的问题,提出了一种基于分布式纳什Q学习的多传感器协同目标跟踪算法.分析了强化学习与分布式纳什Q学习算法的原理;描述了多传感器的协同跟踪态势,建立了离散系统的非线性模型,给出了传统的扩展卡尔曼滤波解决方法;定义了对分布式纳什Q学习性能影响至关重要的传感器行为和奖惩函数,奖惩函数通过计算预测误差方差阵的迹得到;采用基于贝叶斯推理的概率统计方法解决了Q函数的更新问题.纯方位量测信息的被动跟踪仿真结果表明,相比于传统滤波算法,该算法增强了传感器对环境变化的适应性,实现了对目标的有效跟踪,提高了跟踪精度.
目标跟踪、非线性滤波、强化学习、纳什Q学习、分布式控制、多传感器协同、算法
42
TP274(自动化技术及设备)
航空科学基金资助项目20105196016
2013-01-04(万方平台首次上网日期,不代表论文的发表时间)
共6页
60-65