DOI：10.19562/j.chinasae.qcgc.2022.12.001

基于驾驶行为生成机制的智能汽车类人行为决策

引用

摘要：

本文通过分析驾驶人驾驶行为生成机制,构建了类人行为决策策略(HBDS).它具有匹配驾驶行为生成机制的策略框架,通过最大熵逆强化学习得到类人奖励函数,并采用玻尔兹曼理性噪声模型建立行为概率与累积奖励的映射关系.通过预期轨迹空间的离散化处理,避免了连续高维空间积分中的维数灾难,并基于统计学规律和安全约束对预期轨迹空间进行压缩和修剪,提升了HBDS采样效率.HBDS在NGSIM数据集上进行训练和测试的结果表明,HBDS能做出符合驾驶人个性化认知特性和行为特征的行为决策.

关键词：智能汽车、类人驾驶、行为决策、逆强化学习

所属期刊栏目：44

分类号：U463.6;G642.0;G719.21

资助基金：国家自然科学基金52172386

在线出版日期：2023-01-04（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：1797-1808

英文信息展示

期刊专题