10.11959/j.issn.1000-0801.2022152
基于价值差异学习的多小区mMTC接入算法
在5G大连接物联网场景下,针对大连接物联网设备(massive machine type communication device,mMTCD)的接入拥塞现象,提出了基于价值差异探索的双重深度Q网络(double deep Q network with val-ue-difference based exploration,VDBE-DDQN)算法.该算法着重解决了在多小区网络环境下mMTCD接入基站的问题,并将该深度强化算法的状态转移过程建模为马尔可夫决策过程.该算法使用双重深度Q网络来拟合目标状态—动作值函数,并采用基于价值差异的探索策略,可以同时利用当前条件和预期的未来需求来应对环境变化,每个mMTCD根据当前值函数与网络估计的下一时刻值函数的差异来更新探索概率,而不是使用统一的标准,从而为mMTCD选择最佳基站.仿真结果表明,所提算法可有效提高系统的接入成功率.
大连接物联网、随机接入、强化学习、基站选择
38
TN929.5
国家自然科学基金;省部级重点实验室开放课题项目
2022-07-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
82-90