Chombo中的AMRPossion应用的DAG并行化
本文选题:结构化网格 切入点:任务图并行 出处:《山东科技大学》2017年硕士论文 论文类型:学位论文
【摘要】:在过去的十年中,计算机系统不再依靠提高CPU频率来提高系统性能,集成了多个简单内核的多核和众核CPU已成为近十年来的主流技术。如何充分利用多核、众核系统资源获得好的性能是高性能计算应用的关键。结构化网格应用是高性能计算领域的一个典型应用,随着多核和众核平台的广泛应用,如何将已有的代码转换到这些新的并行平台上是一个巨大的挑战。在基于多核、众核平台的结构化网格应用中,由于数据划分而带来的相邻节点间的通信会给整个并行计算系统的性能带来显著影响,分析通信过程并实现通信与计算的重叠可以提高系统的性能。本文在多核平台上,以Chombo中的AMRPossion算例为目标,研究任务图并行方法。首先,分析了结构化网格应用中相邻数据块通信的特点。然后,对迭代计算中相邻数据块之间的依赖关系进行分析,区分本地数据和远程数据,本地数据通过共享存储器实现通讯,而远程数据必须通过节点间的网络实现通讯,是系统性能瓶颈。因此,利用计算与通讯的重叠来掩盖远程数据通信造成的开销,从而提高系统性能。最后,完成了AMRPoisso算例的多进程的任务图并行化,并在自建的多核平台上进行了测试,测试数据表明:与MPI + OpenMP并行模型相比,基于并行任务图DAG+MPI的混合并行程序可以有效地提高性能。
[Abstract]:In the past decade, computer systems have not relied on increasing the frequency of CPU to improve the performance of the system. The multi-core and multi-core CPU integrated with many simple cores has become the mainstream technology in the past decade. The key to the application of high performance computing is to obtain good performance of multi-core system resources. Structured grid application is a typical application in the field of high performance computing, with the wide application of multi-core and multi-core platform. How to convert existing code to these new parallel platforms is a huge challenge. The communication between adjacent nodes due to data partitioning will have a significant impact on the performance of the whole parallel computing system. The performance of the system can be improved by analyzing the communication process and realizing the overlap of communication and computation. Taking the AMRPossion example in Chombo as the target, the parallel method of task diagram is studied. Firstly, the characteristics of adjacent data block communication in structured grid application are analyzed. Then, the dependency relationship between adjacent data blocks in iterative computation is analyzed. Distinguishing between local data and remote data, local data communicates through shared memory, and remote data must communicate through networks between nodes, which is the bottleneck of system performance. The overlap of computation and communication is used to cover up the overhead caused by remote data communication, so as to improve the performance of the system. Finally, the multi-process task diagram of AMRPoisso example is parallelized and tested on the self-built multi-core platform. The test data show that the hybrid parallel program based on parallel task graph DAG MPI can effectively improve the performance compared with the MPI OpenMP parallel model.
【学位授予单位】:山东科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP38
【相似文献】
相关期刊论文 前10条
1 刘键,张静;含过程任务图的调度[J];计算机工程与科学;1997年01期
2 曾国荪,陆鑫达;异构任务图的实现模型[J];同济大学学报(自然科学版);2001年08期
3 黄姝娟;朱怡安;;基于并行优先级任务树的多核调度方法研究[J];西北工业大学学报;2012年05期
4 马锦忠;图Gt的性质及其应用[J];沈阳机电学院学报;1984年02期
5 ;系统[J];电脑迷;2008年05期
6 张德富,,吴巧泉;基于任务图的一种并行程序设计方法(Ⅰ)──任务图的设计[J];软件学报;1995年06期
7 陈华平,李京,陈国良;并行分布计算中条件分支的静态调度[J];小型微型计算机系统;1997年01期
8 尚明生;相关任务图的一种有效并行调度算法[J];计算机工程;2005年14期
9 李庆华,阮幼林,刘干,蒋盛益,杨世达;一个调度Fork-Join任务图的最优算法(英文)[J];软件学报;2005年05期
10 肖勇军,金伟正;移动Ad Hoc网中基于任务图应用的实现[J];计算机工程与应用;2004年35期
相关会议论文 前6条
1 兰彤;冯玉才;肖伟器;;空间连接处理的并行化研究[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
2 张雯;骆志刚;赵翔;王金华;靳新;;剪接比对软件sim4的并行化研究与实现[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
3 王本龙;龚凯;刘桦;;自由表面流动问题的并行化SPH方法求解[A];中国力学学会学术大会'2009论文摘要集[C];2009年
4 曲云伟;;浅议远程数据通讯的几种组网方式[A];推进信息及自动化技术在钢铁工业节能降耗、改善环境、降低成本中的应用论文集[C];2005年
5 王峰;杨建俊;张天爵;许淑艳;;不同操作平台上的MCNP并行化计算[A];中国原子能科学研究院年报 2009[C];2010年
6 陈迹;杜尚丰;;基于GPRS的远程数据测量系统[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
相关重要报纸文章 前6条
1 记者 郑璐;严格按时间表任务图全力推进[N];太行日报;2014年
2 ;服务器软件的并行化革命[N];网络世界;2006年
3 谢涛;英特尔:忽视并行化软件后果很危险[N];电脑商报;2008年
4 李水根;浙江构建农村公卫服务新模式[N];健康报;2006年
5 记者 鲁媛媛;英特尔软件进入并行时代[N];网络世界;2009年
6 ;存储厂商推进远程数据管理[N];计算机世界;2004年
相关博士学位论文 前5条
1 张建军;基于Fork-Join任务图的调度算法研究[D];华中科技大学;2010年
2 郭琦;异构多核可重构平台指令并行化关键问题研究[D];中国科学技术大学;2015年
3 程兴国;仿生算法的动态反馈机制及其并行化实现方法研究[D];华南理工大学;2013年
4 丁晓宁;面向CFD的交互式并行化技术研究[D];西北工业大学;2002年
5 张平;并行化编译器中并行程序自动生成和性能优化技术研究[D];解放军信息工程大学;2006年
相关硕士学位论文 前10条
1 Mohammed Ali Hasan Al-towayti;Chombo中的AMRPossion应用的DAG并行化[D];山东科技大学;2017年
2 荣卓波;基于Hadoop的并行化算法实现及GPS数据实例分析[D];西南大学;2015年
3 赖梓昌;基于MPCore多核并行化的宽景视觉研究与实现[D];西南交通大学;2015年
4 杨睿;基于并行计算的基因序列快速比对方法研究[D];浙江大学;2015年
5 王心阳;一种基于MapReduce模型的并行化TSP算法研究[D];电子科技大学;2015年
6 赵正委;基于BSP模型的网络最大流算法的并行化研究与实现[D];电子科技大学;2014年
7 康少华;空间碎片探测软件的并行化及WCRT分析[D];北京理工大学;2015年
8 王向辉;嵌入式浏览器并行化的研究与设计[D];电子科技大学;2014年
9 孙洁;用于超电大散射计算MLFMA并行化及其关键问题的研究[D];电子科技大学;2014年
10 刘毅;LTE系统中关键算法的研究[D];电子科技大学;2014年
本文编号:1614103
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1614103.html