基于非策略Q-学习的网络控制系统最优跟踪控制
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.13195/j.kzyjc.2019.0417

基于非策略Q-学习的网络控制系统最优跟踪控制

引用
针对具有数据包丢失的网络化控制系统跟踪控制间题,提出一种非策略Q-学习方法,完全利用可测数据,在系统模型参数未知并且网络通信存在数据丢失的情况下,实现系统以近似最优的方式跟踪目标.首先,刻画具有数据包丢失的网络控制系统,提出线性离散网络控制系统跟踪控制间题;然后,设计一个Smith预测器补偿数据包丢失对网络控制系统性能的影响,构建具有数据包丢失补偿的网络控制系统最优跟踪控制间题;最后,融合动态规划和强化学习方法,提出一种非策略Q-学习算法.算法的优点是:不要求系统模型参数己知,利用网络控制系统可测数据,学习基于预测器状态反馈的最优跟踪控制策略;并且该算法能够保证基于Q-函数的迭代Bellman方程解的无偏性.通过仿真验证所提方法的有效性.

网络控制、非策略Q-学习、线性二次跟踪(LQT)、数据包丢失

34

TP13(自动化基础理论)

国家自然科学基金项目61673280, 61525302, 61590922, 61503257;辽宁省高等学校创新人才项目LR2017006;辽宁省自然基金计划重点领域联合开放基金项目2019-KF-03-06;辽宁石油化工大学基金项目2018XJJ-005

2019-11-18(万方平台首次上网日期,不代表论文的发表时间)

共7页

2343-2349

相关文献
评论
暂无封面信息
查看本期封面目录

控制与决策

1001-0920

21-1124/TP

34

2019,34(11)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn