DOI：10.16208/j.issn1000-7024.2023.03.001

基于元学习的自适应视频流算法

引用

摘要：

针对现有的码率自适应(adaptive bitrate,ABR)算法存在控制规则简单,不能有效提升用户体验质量(quality of experience,QoE),提出一种基于元学习的LABR(reinforcement learning based ABR)算法.采用策略梯度训练策略网络,利用元学习(meta-learning)方法学习基线(baseline)函数来减少因网络吞吐量差异产生的方差,进一步提高模型的准确性和鲁棒性;通过在策略函数中加入熵损失方法提高累计期望奖励值.实验结果表明,LABR算法具有泛化性与鲁棒性,能有效提高用户的视频体验质量.

关键词：码率自适应算法、体验质量、元学习、策略梯度、基线、熵损失、期望奖励

所属期刊栏目：44

分类号：TP393(计算技术、计算机技术)

资助基金：国家自然科学基金61462014

在线出版日期：2023-05-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：641-647

英文信息展示

期刊专题