10.16208/j.issn1000-7024.2019.03.017
CUDA下地质图像边缘检测算法并行优化
为提高地质图像边缘检测Prewitt算法计算速度, 结合算法计算密集和数据密集的特点, 从核函数计算层面, 提出基于调整线程块坐标优化线程发散方法和采用本地变量访存优化指令延迟设计思想;从CPU-GPU数据传输开销层面, 提出基于CUDA流优化数据传输开销方法.经测试, 当设置线程块规模为32*32、采用独立的局部变量替代索引访存和使用CUDA工作流分块计算时, 对大于6168*6168尺寸的地质图像加速比可提高120倍以上.该并行优化方案易于实现, 可应用于大规模地质图像边缘检测领域.
边缘检测、Prewitt算子、并行计算、图形处理器、统一计算设备架构
40
TP391(计算技术、计算机技术)
国家自然科学基金项目61562086、61462079;新疆维吾尔自治区创新团队基金项目XJEDU2017T002
2019-05-31(万方平台首次上网日期,不代表论文的发表时间)
共8页
691-698