10.3969/j.issn.1000-3428.2015.12.054
基于CUDA的改进互信息并行计算方法
基于计算统一设备架构(CUDA)的互信息并行计算方法存在因bank冲突而导致执行效率降低的问题.为此,提出一种改进的互信息并行计算方法.利用CUDA的线程层次模型和共享存储器,按等步长数据并行访问方式计算直方图,结合共享存储器,通过分块两次归并方法计算联合熵,采用生成树归并算法避免bank冲突,使用指令展开策略进一步优化执行效率,由熵和联合熵完成互信息计算.实验结果表明,该方法在避免bank冲突的同时,能有效提高互信息计算效率.
计算统一设备架构、图像直方图、图像熵、归一化互信息、并行计算
41
TP391.41(计算技术、计算机技术)
国家自然科学基金资助项目60962004,61162016;甘肃省科技支撑计划基金资助项目144WCGA162,1104FKCA102;兰州交通大学青年基金资助项目2013005
2016-02-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
288-292,298