10.3969/j.issn.1671-7449.2020.02.012
无线网络中基于深度强化学习的资源分配研究
由于用户设备的多样性,直播视频必须转换为不同的格式.且由于无线网络环境的动态特性,为用户提供高质量和严格的时延要求的实时视频是一个很大的挑战.本文提出了一种联合优化用户调度、视频质量选择和资源分配的方案,以达到在视频直播业务中最大化视频质量的同时尽可能减少播放延迟的目标.通过深度Actor-Critic强化学习算法进行仿真.仿真结果表明,本文提出的方案可以提高用户视频体验质量(QoE),并且相比于策略梯度算法(PG),本文算法学习速度更快.
雾计算、资源分配、视频直播、强化学习、神经网络
34
TP393(计算技术、计算机技术)
2020-04-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
152-158