10.16208/j.issn1000-7024.2017.12.030
基于龙芯SIMD技术的H.264视频解码优化
为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法.通过分析FFmpeg的开源H.264解码器的并行特征,结合龙芯处理器的结构并行特点,利用龙芯特有的性能计数器,解析影响性能的热点函数,采用手工嵌入龙芯SIMD和访存扩展等汇编指令的方式进行细粒度优化.实验结果表明,该方法使平均性能提高了50%,工作成果已推送到龙芯开源社区,增强了基于龙芯3A处理器的国产计算机在桌面多媒体应用领域的用户体验.
单指令流多数据流、龙芯3A、GS464/GS464E微架构、FFmpeg多媒体库、H.264解码优化
38
TP302(计算技术、计算机技术)
江苏省工业和信息产业转型升级专项基金
2018-04-02(万方平台首次上网日期,不代表论文的发表时间)
共8页
3361-3367,3373