基于多GPU的PCG算法并行研究及其在地下水流动模拟中的应用

发布时间:2021-04-28 10:26
  PCG算法的并行化对许多研究问题有重要意义,可通过提高求解方程组的效率来提高数值模拟的效率。为了科学使用地下水资源往往需要分析预测其流动规律。随着研究的不断发展,地下水数值模拟程序MODFLOW已经不能很好的对大规模实验问题进行模拟分析。为了提高模拟效率,本文主要研究在多GPU环境下对PCG算法的并行化,并将其应用于MODFLOW中,从而实现MODFLOW的并行模拟。本文将PCG算法中的线性代数运算实现为基于CUDA的核函数,重点研究DIA格式并实现了较为高效的SpMV核函数。为了在单节点多GPU环境下对PCG并行化,计算任务被均等划分并分别求解,求解过程中GPU间数据传输是性能瓶颈,为此本文通过减少非必要的数据传输和将SpMV计算与传输重叠的方法来减少数据传输开销,提高PCG的加速比。在单节点环境中使用6个GPU的条件下,PCG的加速比随着GPU数量的增多和数据规模的增大而得到明显提高,最高达到36.3。在多节点环境中,通过MPI创建多个进程来通过多个GPU求解方程组,本文通过合理的数据传输模型来统一节点内和节点间数据传输的差异性,使其具有可移植性和高效性。在使用2个节点4个GPU的... 

【文章来源】:中国地质大学(北京)北京市 211工程院校 教育部直属院校

【文章页数】:70 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景
    1.2 国内外研究现状
    1.3 研究目标与内容
    1.4 论文组织结构
第2章 相关内容介绍
    2.1 预条件共轭梯度算法
    2.2 稀疏矩阵的存储格式
    2.3 地下水流动数值模型
    2.4 并行计算相关技术
        2.4.1 GPU架构
        2.4.2 CUDA编程模型
        2.4.3 OpenMP编程模型
        2.4.4 MPI编程模型
    2.5 本章小结
第3章 基于多GPU的 PCG算法并行研究
    3.1 基于CUDA的 PCG并行研究
        3.1.1 PCG并行化分析
        3.1.2 稀疏矩阵的存储
        3.1.3 高性能Sp MV设计
    3.2 基于单节点的PCG并行计算
        3.2.1 单节点并行架构设计
        3.2.2 GPU间的数据传输
        3.2.3 数据传输优化
        3.2.4 实验与结果分析
    3.3 基于多节点的PCG并行计算
        3.3.1 多节点并行架构设计
        3.3.2 数据传输模型
        3.3.3 实验与结果分析
    3.4 本章小结
第4章 基于多GPU的地下水模拟并行研究
    4.1 地下水模拟程序结构分析
    4.2 基于单节点的地下水模拟并行加速
        4.2.1 单节点并行模拟流程
        4.2.2 实验与结果分析
    4.3 基于多节点的地下水模拟并行加速
        4.3.1 多节点并行模拟流程
        4.3.2 实验与结果分析
    4.4 本章小结
第5章 总结与展望
    5.1 总结
    5.2 展望
致谢
参考文献
附录


【参考文献】:
博士论文
[1]地下水流动空间数据并行计算的研究[D]. 李丹丹.中国地质大学(北京) 2014
[2]地下水流动数值模拟的高效并行计算研究[D]. 程汤培.中国地质大学(北京) 2011



本文编号:3165314

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3165314.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户850bc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com