10.3969/j.issn.1672-9722.2022.09.011
基于异构融合特征的深度强化学习自动驾驶决策方法
在自动驾驶决策方法中,传统模块化方法受限制于数据集的广泛性,基于强化学习的方法难以在高输入维度且动作空间连续的情况下有效学习.为了解决上述问题,提出了一种基于异构融合特征的深度强化学习自动驾驶决策方法,首先使用适量驾驶数据预训练图像降维网络,然后将降维后得到的图像特征和车辆状态特征进行异构融合作为强化学习的输入,采用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)强化学习框架,通过为自动驾驶量身定制的综合了速度、方向盘角度、车辆位置、碰撞等信息的奖励函数有效引导学习,结合经验池回放技术和目标网络技术提高训练收敛速度.所提方法有效缩短了训练时间,并可在复杂城市环境下保持较高的稳定性与鲁棒性.
深度强化学习、自动驾驶、异构融合特征、DDPG、奖励函数
50
V323.19(航空飞行术)
国防科技创新特区火花课题;国家自然科学基金
2022-11-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
1929-1934