10.19562/j.chinasae.qcgc.2022.12.001
基于驾驶行为生成机制的智能汽车类人行为决策
本文通过分析驾驶人驾驶行为生成机制,构建了类人行为决策策略(HBDS).它具有匹配驾驶行为生成机制的策略框架,通过最大熵逆强化学习得到类人奖励函数,并采用玻尔兹曼理性噪声模型建立行为概率与累积奖励的映射关系.通过预期轨迹空间的离散化处理,避免了连续高维空间积分中的维数灾难,并基于统计学规律和安全约束对预期轨迹空间进行压缩和修剪,提升了HBDS采样效率.HBDS在NGSIM数据集上进行训练和测试的结果表明,HBDS能做出符合驾驶人个性化认知特性和行为特征的行为决策.
智能汽车、类人驾驶、行为决策、逆强化学习
44
U463.6;G642.0;G719.21
国家自然科学基金52172386
2023-01-04(万方平台首次上网日期,不代表论文的发表时间)
共12页
1797-1808