基于深度确定性策略梯度的队列纵向协同控制策略
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.19721/j.cnki.1671-8879.2021.04.009

基于深度确定性策略梯度的队列纵向协同控制策略

引用
为了解决车辆队列控制中的车辆连续精确控制问题和行驶过程中车辆队列纵向稳定性问题,提出了 一种在中等速度环境下基于深度强化学习(deep reinforcement learning,DRL)的车辆队列纵向控制策略.该策略充分考虑了影响队列安全的车辆距离、车辆速度和车辆加速度3个关键影响因素,并将车辆动力学和舒适性作为策略学习过程中的约束条件.首先,建立基于强化学习的车辆队列纵向控制模型.其次,提出一个深度强化学习过程来进行队列纵向控制策略的迭代,最终目标为获得车辆的最优控制策略;并且设计了一个多 目标的奖励函数,该函数综合了距离误差、速度误差和加速度约束对应的奖励.最后,采用深度确定性策略梯度(deep deterministic policy gra-dient,DDPG)求解队列纵向控制问题,该算法将动作-评价(actor-critic,AC)网络的优点与深度Q网络(deep Q-network,DQN)的优点相结合,有效解决连续状态空间和连续动作空间上的车辆队列控制问题;并设计和训练了基于DDPG的队列控制模型用于队列纵向控制,验证该控制策略的有效性.结果表明:提出的基于强化学习的队列控制方法具有和分布式模型预测控制算法相当的控制精度,并能在"前车-领航车跟随"通信拓扑下实现队列的串稳定性.

交通工程;深度强化学习;队列纵向控制;深度确定性策略梯度;队列稳定性

41

U491.15(交通工程与公路运输技术管理)

国家自然科学基金项目;陕西省重点研发计划项目;浙江省重点研发计划项目;"车联网"教育部-中国移动联合实验室基金项目

2021-09-23(万方平台首次上网日期,不代表论文的发表时间)

共11页

90-100

相关文献
评论
暂无封面信息
查看本期封面目录

长安大学学报(自然科学版)

1671-8879

61-1393/N

41

2021,41(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn