10.11959/j.issn.1000-436x.2018058
无线网络中基于深度Q学习的传输调度方案
针对无线网络中的数据传输问题,提出一种基于深度Q学习(QL, Q learning)的传输调度方案.该方案通过建立马尔可夫决策过程(MDP, Markov decision process)系统模型来描述系统的状态转移情况;使用Q学习算法在系统状态转移概率未知的情况下学习和探索系统的状态转移信息,以获取调度节点的近似最优策略.另外,当系统状态的规模较大时,采用深度学习(DL, deep learning)的方法来建立状态和行为之间的映射关系,以避免策略求解中产生的较大计算量和存储空间.仿真结果表明,该方法在功耗、吞吐量、分组丢失率方面的性能逼近基于策略迭代的最优策略,且算法复杂度较低,解决了维灾问题.
无线网络传输、马尔可夫决策过程、Q学习、深度学习
39
TN929.5
国家自然科学基金资助项目61102062,61271260,61301122;重庆市基础与前沿研究计划基金资助项目No.cstc2015jcyjA40050The National Natural Science Foundation of China61102062,61271260,61301122;Chongqing Research Program of Basic Research and Frontier Technologycstc2015jcyjA40050
2018-06-12(万方平台首次上网日期,不代表论文的发表时间)
共10页
35-44