10.12141/j.issn.1000-565X.220221
深层特征域运动估计和多层多假设运动补偿的视频压缩编解码网络
传统视频压缩编码方法被广泛使用,为了进一步提高压缩性能,基于深度学习的视频压缩编码方法的研究日益受到关注.现有深度学习的视频压缩编码方法基于光流实现运动补偿,在光流对齐过程中会产生伪影现象,降低了预测的准确性.文中提出了深层特征域的运动估计思路,设计了相应的神经网络在深层特征域提取运动信息.在此基础上,提出了多层多假设预测的运动补偿网络,通过在深层特征域、浅层特征域以及像素域3个层次使用多假设预测模块,提升运动补偿的准确性,提高整体的率失真性能.仿真结果表明,文中算法帧间预测结果减缓了伪影现象,视觉效果明显优于光流对齐.同时,文中算法与传统H.264、H.265方法和基于深度学习的单帧参考方法DVC、DVCpro相比,在高比特率和低比特率的情况下均取得了较好的率失真性能.与研究前沿的DCVC方法相比,在率失真性能相近的同时,文中算法减少了约26.8%的编码时间.以H.264编码结果为基准,于相同比特率条件下,文中算法在HEVC测试序列ClassB、ClassD、ClassE上的解码质量分别提升3.73、4.76、2.65 dB.由仿真实验结果可知,文中算法对视频序列进行压缩编码时,提高了运动补偿预测帧的准确度,降低了预测误差,缩短了残差信号压缩编码码流,提升了整体的率失真性能.
视频压缩、深度学习、运动估计、多假设预测、编解码网络
50
TN919.8
广东省自然科学基金资助项目;广东省自然科学基金资助项目
2022-12-30(万方平台首次上网日期,不代表论文的发表时间)
共11页
51-61