当前位置:主页 > 科技论文 > 计算机论文 >

球谐函数展开快速算法及其并行算法研究

发布时间:2021-05-06 17:54
  计算机技术的迅速发展促进了数值天气预报模式的不断推进,并使偏微分方程离散化相关的数值方法变得更加完善和精确,从而减小了求偏微分方程数值解的误差。谱变换方法采用球谐函数的有限截断展开来逼近球面某垂直层上的状态变量,充分利用变量在物理空间和谱空间之间的适当变换,有效降低偏微分方程中以非线性项为主的计算量,进而获得高精度的计算解。其中物理空间由状态变量在经纬度格点的直积组成,谱空间由状态变量对应的截断球谐函数展开系数组成。谱模式具有精度高、稳定性好等优点,但其运算量和存储量较大。球谐函数展开作为一种数学方法,被广泛应用于数值天气预报模式、地球物理、化学物理、偏微分方程数值解等众多领域。球谐函数是球面纬向微分算子以及球面Laplace算子的特征函数。基于球谐函数的谱变换,是谱模式计算中的核心问题,涉及Fourier变换和Legendre变换,其中Fourier变换应用于经度方向,Legendre变换应用于纬度方向。本文基于Rokhlin-Tygert球谐函数展开快速算法,深入研究了算法的并行化问题,主要内容包括:(1)分析数值天气预报谱模式以及球谐函数的特点,研究了并行计算理论和技术,包括MP... 

【文章来源】:国防科技大学湖南省 211工程院校 985工程院校

【文章页数】:84 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 引言
    1.1 数值天气预报与谱模式
        1.1.1 谱模式的发展与现状
        1.1.2 球谐函数与SⅠlberman 方法
        1.1.3 变换法
        1.1.4 谱模式的优缺点
    1.2 球谐函数
        1.2.1 球谐函数的推导
        1.2.2 截断问题
        1.2.3 球谐函数展开算法的发展
    1.3 GPU 通用计算与数值天气预报
    1.4 本文研究内容
    1.5 论文结构
第二章 CPU/GPU 异构集群研究
    2.1 GPU 发展的历史与现状
    2.2 CPU/GPU 异构集群
        2.2.1 CPU 与GPU 的性能对比
        2.2.2 典型CPU/GPU 异构集群
    2.3 并行编程环境
        2.3.1 MPⅠ 并行程序设计原理
        2.3.2 CUDA 架构与编程模型
        2.3.3 MPⅠ+CUDA 混合编程模型研究
第三章 球谐函数展开快速算法研究
    3.1 球谐函数展开简介
    3.2 RokhlⅠn-Tygert 球谐函数展开快速算法
        3.2.1 SerSTEP1:函数分解
        3.2.2 SerSTEP2:快速FourⅠer 变换
            3.2.2.1 余弦变换
            3.2.2.2 正弦变换
        3.2.3 SerSTEP3:低阶连带Legendre 多项式展开系数
        3.2.4 SerSTEP4:任意阶连带Legendre 多项式展开系数
    3.3 0 阶Legendre 多项式展开系数的计算
        3.3.1 直接法
        3.3.2 变换法
        3.3.3 两种方法比较
    3.4 标准特征向量矩阵的计算
    3.5 RT 算法串行程序实现
第四章 RT 算法的MPⅠ 并行程序设计
    4.1 RT 算法的并行策略
    4.2 RT 并行算法描述
    4.3 RT 并行算法的MPⅠ 实现
        4.3.1 程序结构
        4.3.2 通信机制
        4.3.3 同步策略
    4.4 RT 算法的MPⅠ 并行程序实验及分析
        4.4.1 实验方案Ⅰ
        4.4.2 实验方案Ⅱ
        4.4.3 实验方案Ⅲ
第五章 RT 算法的MPⅠ+CUDA 并行程序设计
    5.1 GPU 在RT 算法中的加速策略
        5.1.1 GPU 在RT 串行算法中的加速策略
        5.1.2 GPU 在RT 并行算法中的加速策略
    5.2 库函数
        5.2.1 CuFFT
        5.2.2 LAPACK
        5.2.3 CULA
        5.2.4 CulaBLAS
    5.3 RT 算法的异构混合并行实现
        5.3.1 RT 算法串行程序的CUDA 加速
        5.3.2 RT 算法MPⅠ+CUDA 异构并行实现
    5.4 RT 算法的异构并行程序实验
        5.4.1 实验方案Ⅰ
        5.4.2 实验方案Ⅱ
        5.4.3 实验方案Ⅲ
        5.4.4 实验方案ⅠV
        5.4.5 实验方案V
第六章 结论与展望
致谢
参考文献
作者在学期间取得的学术成果
附录A 公式推导


【参考文献】:
期刊论文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 杨学军,廖湘科,卢凯,胡庆丰,宋君强,苏金树.  Journal of Computer Science & Technology. 2011(03)
[2]CPU/GPU协同并行计算研究综述[J]. 卢风顺,宋君强,银福康,张理论.  计算机科学. 2011(03)
[3]基于SMP集群的MPI+CUDA模型的研究与实现[J]. 许彦芹,陈庆奎.  计算机工程与设计. 2010(15)
[4]CUDA并行计算的应用研究[J]. 董荦,葛万成,陈康力.  信息技术. 2010(04)
[5]CUDA高性能计算并行编程[J]. 李波,赵华成,张敏芳.  微型电脑应用. 2009(09)
[6]GPU与CPU的比较分析[J]. 钟联波.  技术与市场. 2009(09)
[7]使用GPU加速通用科学计算-CUDA技术解析[J]. 刘勇.  科技信息(科学教研). 2008(24)
[8]谱方法数值计算研究进展[J]. 张理论,李晓梅,宋君强.  指挥技术学院学报. 2001(06)
[9]一个基于大气自忆原理的谱模式[J]. 谷湘潜.  科学通报. 1998(09)
[10]大气谱模式中质量守恒格式的研究[J]. 陈嘉滨,舒静君.  大气科学. 1996(02)

博士论文
[1]GRAPES高分辨率气象数值预报模式并行计算关键技术研究[D]. 伍湘君.国防科学技术大学 2011

硕士论文
[1]GPS掩星资料处理的GPU并行算法研究[D]. 银福康.国防科学技术大学 2010



本文编号:3172368

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3172368.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8edb6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com