基于Q-Learning算法和神经网络的飞艇控制
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.13700/j.bh.1001-5965.2016.0903

基于Q-Learning算法和神经网络的飞艇控制

引用
针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的控制策略.设计了一种在分析实际运动的基础上建立飞艇控制马尔可夫决策过程(MDP)模型的方法,具有自适应性.采用Q-Learning算法进行在线学习并利用小脑模型关节控制器(CMAC)神经网络对动作值函数进行泛化加速.对本文方法进行仿真并与经过参数整定的PID控制器对比,验证了该控制策略的有效性.结果表明,在线学习过程能够在数小时内收敛,通过自适应方法建立的MDP模型能够满足常见飞艇控制任务的需求.本文所提控制器能够获得与PID控制器精度相当且更为智能的控制效果.

飞艇、马尔可夫决策过程(MDP)、机器学习、Q-Learning、小脑模型关节控制器(CMAC)

43

V274;V249.22(各类型航空器)

2018-05-07(万方平台首次上网日期,不代表论文的发表时间)

共8页

2431-2438

相关文献
评论
暂无封面信息
查看本期封面目录

北京航空航天大学学报

1001-5965

11-2625/V

43

2017,43(12)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn