10.3969/j.issn.1007-130X.2021.05.010
基于多智能体Q学习的异构车载网络选择方法
异构车载网络环境下如何选择接入网络对于车载终端用户的服务体验而言至关重要,目前基于Q学习的网络选择方法利用智能体与环境的交互来迭代学习网络选择策略,从而实现较优的网络资源分配.然而该类方法通常存在状态空间过大引起迭代效率低下和收敛速度较慢的问题,同时由于Q值表更新产生的过高估计现象容易导致网络资源利用不均衡.针对上述问题,基于多智能体Q学习提出一种适用于融合5G通信异构车载网络的选择方法M QSM.该方法采用多智能体协作学习的思想,利用双Q值表交替更新的方式来获得动作选择的总回报值,最终实现异构车载网络环境下长期有效的最优网络切换决策集合.实验结果表明,与同类型方法相比较,M QSM在系统总切换次数、平均总折扣值和网络容量利用率方面表现出更好的性能.
多智能体、Q学习、网络选择、异构车载网络、5G通信
43
TP393(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;湖北省自然科学基金
2021-06-02(万方平台首次上网日期,不代表论文的发表时间)
共9页
836-844