从SSE到OpenCL:多核CPU上骨骼动画并行算法对比研究
拥有高精度蒙皮和复杂骨骼绑定关系的骨骼动画,渲染时存在很大的性能瓶颈.以往研究采用GPU加速动画,但高端GPU成本过高,而中低端GPU的通用计算性能有时不如高端CPU.为充分挖掘算法在多核CPU上的执行性能,弥补中低端GPU通用计算性能的不足,提出了基于OpenCL的针对指令和线程的新兴集成并行方案,并与基于SSE结合OpenMP针对指令和线程的传统独立并行方案展开对比.实验结果表明,在多数CPU和多种复杂度的数据上,基于OpenCL的新兴并行方案的性能明显高于基于SSE的传统并行方案,并且性能优势随着数据复杂度的增加而提升.
骨骼动画、并行计算、OpenCL、SSE
27
TP391.9(计算技术、计算机技术)
国家海洋局数字海洋科学技术重点实验室开放基金KLDO201303
2015-04-20(万方平台首次上网日期,不代表论文的发表时间)
336-343,351