当前位置:主页 > 科技论文 > 计算机论文 >

基于国产高性能计算机的GRAPES性能优化研究

发布时间:2017-05-24 10:25

  本文关键词:基于国产高性能计算机的GRAPES性能优化研究,由笔耕文化传播整理发布。


【摘要】:数值天气预报系统是一个高性能计算技术与数值天气预报技术结合的综合性学科。数值天气预报技术的发展是推动高性能计算机发展的重要动力,而高性能计算的发展为数值天气预报系统采用更加复杂准确的预报模型提供了软硬件基础。近年来,高性能计算机的性能不断攀升,出现了以异构众核处理器为组建部件的异构高性能计算机。与传统的单核或多核处理器相比,异构处理器的存储体系和访存方式发生了巨大的变化,需要研究新的并行计算方法发挥异构高性能计算机的体系结构优势。GRAPES是我国自主研发的新一代研究/业务数值天气预报系统,其通信模式和计算过程复杂,代码量高达十万余行。如何利用新一代国产异构高性能计算机的体系结构优势,提高GRAPES模式在国产高性能计算机上的运算效率和计算速度,达到实际数值预报业务的时限要求,改善GRAPES模式在大规模并行时的可扩展性,是亟待研究的问题。本文研究了GRAPES的计算原理,对GRAPES程序结构进行了分析并找到影响GRAPES并行效率和可扩展性的热点子程序。通过对国产高性能计算系统的深入了解,构建了实验所需的MPI并行环境。针对模式I/O及初始化部分“通信热点”集中,系统消息缓存过大等问题,为各个子程序分别设计了高效的通信策略,有效提升了程序的可扩展性和运行速度,其中部分子程序的性能提升达到5倍以上。对于模式迭代积分过程,设计了“粗粒度MPI并行+细粒度众核并行”多级异构并行方案,充分利用异构高性能计算机的体系结构优势,使用数量众多的协处理器为GRAPES模式的迭代积分过程提供加速效果,并提出了几种多级异构并行方案的优化策略,有效提升了该方案的并行效率,在使用4096至256颗处理器核进行10天预报迭代积分过程时,可分别减少1至6个小时不等的运行时间。通过使用两种不同分辨率的输入数据,在多个并行规模下对优化方案进行测试,得到了程序各部分消耗的墙钟时间,并计算了程序的加速比和并行效率。实验结果表明,本文设计的各种优化方案有效地提高了GRAPES模式的运行效率,改善了GRAPES模式的可扩展性,充分发挥了异构众核处理器的优势,使GRAPES模式能够达到实际数值预报业务的时限要求。此外,本文提出的多级异构并行计算方案和优化策略不仅适用于数值天气预报系统GRAPES,也适用于其他具有多重循环的高性能计算课题,具有一定的推广意义。
【关键词】:GRAPES模式 数值天气预报 并行计算 异构计算机 多级并行 优化策略
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP38
【目录】:
  • 摘要3-5
  • ABSTRACT5-10
  • 第一章 绪论10-15
  • 1.1 研究背景10-13
  • 1.1.1 数值天气预报发展概况10-11
  • 1.1.2 国内外高性能计算系统发展概况11-13
  • 1.2 课题来源及目的13-14
  • 1.3 本文主要研究内容14-15
  • 第二章 消息传递接口及实验平台综述15-21
  • 2.1 消息传递编程规范15-17
  • 2.1.1 消息传递编程模型15-16
  • 2.1.2 MPI的产生16
  • 2.1.3 MPI的实现16-17
  • 2.2 MPI并行环境构建17-19
  • 2.2.1 本课题采用的MPI实现17-18
  • 2.2.2 配置MPICH实验环境18-19
  • 2.3 硬件环境介绍19-20
  • 2.4 本章小结20-21
  • 第三章 程序结构及性能分析21-26
  • 3.1 GRAPES程序结构21-23
  • 3.2 GRAPES并行区域分解方案23-24
  • 3.3 程序性能数据获取及分析24-25
  • 3.3.1 获取程序性能数据24
  • 3.3.2 性能数据分析24-25
  • 3.4 本章小结25-26
  • 第四章 GRAPES模式I/O及初始化优化26-35
  • 4.1 GRAPES_INPUT子程序优化方案设计与实现26-30
  • 4.1.1 grapes_input子程序结构分析26-28
  • 4.1.2 grapes_input子程序优化方案设计28-30
  • 4.2 COLM_INIT子程序优化方案设计与实现30-32
  • 4.2.1 colm_init子程序结构分析30-31
  • 4.2.2 colm_init子程序优化方案设计31-32
  • 4.3 模式输出子程序优化方案设计与实现32-34
  • 4.3.1 模式输出子程序结构分析32-33
  • 4.3.2 模式输出子程序优化方案设计33-34
  • 4.4 本章小结34-35
  • 第五章 GRAPES异构并行算法研究35-46
  • 5.1 众核并行编程模型介绍35-36
  • 5.2 GRAPES多级混合并行编程方案设计36-38
  • 5.3 众核并行编程优化策略38-39
  • 5.3.1 数据布局优化38
  • 5.3.2 计算与DMA通信相互隐藏38-39
  • 5.3.3 离散数组内存调整39
  • 5.4 众核并行编程的实现39-44
  • 5.4.1 众核并行编程方法39-43
  • 5.4.2 使用Open Acc进行众核编程43-44
  • 5.5 本章小结44-46
  • 第六章 实验结果与性能分析46-57
  • 6.1 模式I/O及初始化优化结果及分析46-49
  • 6.1.1 grapes_input子程序优化结果46-47
  • 6.1.2 colm_init子程序优化结果47-48
  • 6.1.3 模式输出子程序优化结果48-49
  • 6.2 模式积分迭代过程优化结果及分析49-52
  • 6.3 预报结果验证52-56
  • 6.4 本章小结56-57
  • 第七章 总结与展望57-59
  • 7.1 全文工作总结57
  • 7.2 进一步研究的展望57-59
  • 参考文献59-62
  • 致谢62-63
  • 攻读学位期间发表的学术论文63-65

【相似文献】

中国期刊全文数据库 前10条

1 樊建平;;高性能计算机的发展现状与趋势[J];计算机教育;2004年05期

2 笑春风;;权威看台向您诠释——中国高性能计算机的今天、明天[J];计算机教育;2004年06期

3 李国杰;;高性能计算机是先进生产力[J];计算机教育;2004年06期

4 樊建平,陈明宇;追踪下一代高性能计算机前沿热点[J];科技潮;2004年05期

5 ;高性能计算机标准:在希望与光明中前行[J];信息技术与标准化;2007年06期

6 ;国内首次高性能计算机相关标准立项批准[J];现代电子技术;2007年11期

7 ;我国研制成功首台采用龙芯2号的国产万亿次高性能计算机[J];中国集成电路;2008年01期

8 ;我国首台万亿次高性能计算机诞生[J];大众科技;2008年02期

9 朱莹;;浅谈高性能计算机的发展现状和瓶颈[J];科技情报开发与经济;2008年18期

10 ;我国将制定高性能计算机石油行业应用标准[J];计量与测试技术;2009年07期

中国重要会议论文全文数据库 前10条

1 ;《计算机研究与发展》高性能计算机及应用专刊(2005年)征稿启事[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

2 孙凝辉;;高性能计算机的应用和发展[A];第六届全国计算机应用联合学术会议论文集[C];2002年

3 曹燕;;国家气象信息中心高性能计算机的现状及展望[A];信息技术在气象领域的开发应用论文集(一)[C];2005年

4 陈国良;;高性能计算及其应用(节选)[A];“广东科协论坛第27期:高性能计算与技术创新”荟萃[C];2009年

5 黄金礼;刘光明;胡维;;基于网络服务的高性能计算机能耗管理研究[A];第十六届计算机工程与工艺年会暨第二届微处理器技术论坛论文集[C];2012年

6 黄清南;梁晓光;张利发;;高性能计算机上光子输运的并行计算[A];中国工程物理研究院科技年报(1998)[C];1998年

7 魏帆;张宝花;刘倩;金钟;;面向新一代高性能计算机的量子化学程序并行化框架[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年

8 彭德纯;;分布式并行处理研究的若干问题[A];IEEE北京分会第一届学术年会论文集[C];1987年

9 许榕生;周玉林;吴春珍;;高性能计算机在物理学中的应用[A];第8届全国核电子学与核探测技术学术年会论文集(二)[C];1996年

10 刘菁;冯丹;;高性能计算机在河南省气象局的应用探讨[A];2011年中国气象学会气象通信与信息技术委员会暨国家气象信息中心科技年会论文摘要[C];2011年

中国重要报纸全文数据库 前10条

1 本报记者 刘路沙;我国高性能计算机如何再攀高峰[N];光明日报;2003年

2 徐建华;高性能计算机标准助力信息产业[N];中国质量报;2007年

3 宁雷;高性能计算机标准有望出台[N];中国电脑教育报;2007年

4 本报记者 宁雷;曙光牵头成立中国高性能计算机标准工作委员会[N];中国电脑教育报;2007年

5 韩丹;高性能计算机标准制定将遇阻力[N];经济参考报;2007年

6 曹增光;中国冲顶高性能计算机标准[N];中国经济时报;2007年

7 原国锋;高性能计算机亟需国家标准[N];人民日报;2007年

8 本报记者 朱毅 胡志敏;期待国产高性能计算机“破冰”[N];政府采购信息报;2006年

9 冯晓芳 赵晓辉;我国高性能计算机标准制定蓄势待发[N];中国信息报;2007年

10 尹训宁;我国将研究制定高性能计算机标准[N];中国知识产权报;2007年

中国博士学位论文全文数据库 前1条

1 李晖;高性能计算机若干关键问题研究[D];中国科学技术大学;2009年

中国硕士学位论文全文数据库 前9条

1 喻杰;面向高性能计算机体系结构的MapReduce编程框架优化研究[D];国防科学技术大学;2013年

2 刘钊;基于国产高性能计算机的GRAPES性能优化研究[D];上海交通大学;2014年

3 陈良;大型高性能计算机集群故障快速诊断与自动恢复系统开发[D];电子科技大学;2012年

4 雷强;高性能计算机功耗管理系统设计与实现[D];国防科学技术大学;2012年

5 黄,

本文编号:390524


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/390524.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d1aae***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com