一种基于CPU/GPU异构平台的FIR滤波并行实现方法
本发明涉及一种基于CPU/GPU异构平台的FIR滤波并行实现方法,合理布局GPU kernel函数的网格结构,运行GPU kernel函数,由网格结构中每个块Block的所有线程Thread并行地将待滤波数据从GPU显存读取到GPU共享内存,每个Thread依据线性相位FIR滤波公式计算滤波结果,所有Thread并行计算,将GPU中所有Thread计算结果从GPU显存拷贝至CPU内存,从CPU内存输出FIR滤波器的滤波结果。本发明充分利用CPU/GPU并行处理的优势,克服目前软件实现FIR滤波计算速度低、占用资源较多的不足,解决了实时处理大数据量高速滤波的难题。
发明专利
CN201410141793.9
2014-04-10
CN103956991A
2014-07-30
H03H17/02(2006.01)I
北京遥测技术研究所%航天长征火箭技术有限公司
王静温;刘文俊;苏丽;丁兴文
100076 北京市丰台区北京市9200信箱74分箱
中国航天科技专利中心 11009
安丽
北京;11
一种基于CPU/GPU异构平台的FIR滤波并行实现方法,其特征在于包括如下步骤:(1)将CPU内存待滤波的音频/视频数据拷贝至图形处理器GPU显存中;(2)根据步骤(1)待滤波的音频/视频数据量和GPU共享内存大小合理布局GPU内核kernel函数的网格结构;(3)步骤(2)网格结构中所有线程Thread运行GPU kernel函数,通过多个Thread并行地将步骤(1)中待滤波数据从GPU显存读取到GPU共享内存;(4)每个Thread在步骤(3)共享内存上依据线性相位FIR直接型结构计算FIR滤波器的滤波结果,一个Thread计算一个滤波结果,所有Thread并行计算;(5)将步骤(4)中所有Thread计算出的FIR滤波结果从GPU显存拷贝至CPU内存;(6)从CPU输出FIR滤波器的滤波结果。