10.11772/j.issn.1001-9081.2014.07.1857
融合遗传和蚁群算法并行求解最短公共超串
依据各级缓存容量,将CPU主存中种群个体和蚂蚁个体数据划分存储到一级、二级和三级缓存中,以减少并行计算过程中数据在各级存储之间的传输开销,在CPU与GPU之间采取异步传送和不完全传送数据、GPU多个内核函数异步执行多个流的方法,设置GPU block线程数量为16的倍数、GPU共享存储器划分大小为32倍的bank,使用GPU常量存储器存储交叉概率、变异概率等需频繁访问的只读参数,将输入串矩阵和重叠部分长度矩阵只读大数据结构绑定到GPU纹理存储器,设计实现了一种多核CPU和GPU协同求解最短公共超串问题的计算、存储和通信高效的并行算法.求解多种规模的最短公共超串问题的实验结果表明,多核CPU与GPU协同并行算法比串行算法快70倍以上.
最短公共超串、并行算法、GPU计算、遗传算法、蚁群算法
34
TP338.6;TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目60963001;广西研究生教育创新计划项目YCSZ2013006;广西教育厅—广西大学博士点建设基金资助项目P11900119
2014-08-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
1857-1861,1866