10.16208/j.issn1000-7024.2023.03.001
基于元学习的自适应视频流算法
针对现有的码率自适应(adaptive bitrate,ABR)算法存在控制规则简单,不能有效提升用户体验质量(quality of experience,QoE),提出一种基于元学习的LABR(reinforcement learning based ABR)算法.采用策略梯度训练策略网络,利用元学习(meta-learning)方法学习基线(baseline)函数来减少因网络吞吐量差异产生的方差,进一步提高模型的准确性和鲁棒性;通过在策略函数中加入熵损失方法提高累计期望奖励值.实验结果表明,LABR算法具有泛化性与鲁棒性,能有效提高用户的视频体验质量.
码率自适应算法、体验质量、元学习、策略梯度、基线、熵损失、期望奖励
44
TP393(计算技术、计算机技术)
国家自然科学基金61462014
2023-05-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
641-647