Bellman-Ford算法性能可移植的GPU并行优化
发布时间:2018-05-02 10:30
本文选题:计算机软件 + Bellman-Ford算法 ; 参考:《吉林大学学报(工学版)》2015年05期
【摘要】:提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AMD的多款GPU设备上都取得了很好的效果,经本文算法优化后的程序性能较原始GPU并行版本提升3~6倍。
[Abstract]:In this paper, a parallel reduction extremum optimization algorithm and a global memory access optimization algorithm for GPU are proposed, which can transform the Bellman-Ford algorithm into parallelization. In order to solve the problems of parallel granularity deficiency and global memory access discontinuity on different types of GPU devices. The experimental results show that the proposed optimization algorithm has achieved good results on both NVIDIA and AMD GPU devices, and the performance of the program optimized by the proposed algorithm is 3 times higher than that of the original GPU parallel version.
【作者单位】: 吉林大学计算机科学与技术学院;中信证券有限公司;中国科学院计算技术研究所;
【基金】:吉林省重大科技攻关项目(20130206052GX) “863”国家高技术研究发展计划项目(2012AA010902) “973”国家重点基础研究计划项目(2011CB302500)
【分类号】:TP332;TP301.6
【相似文献】
相关期刊论文 前3条
1 徐俊波;王慧强;冯光升;吕宏武;田苏梅;;Bellman动态规划的服务恢复方法[J];哈尔滨工程大学学报;2011年06期
2 刘立平;陈s,
本文编号:1833516
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1833516.html