基于键涨落模型数值模拟的并行优化
本文选题:并行计算 切入点:高分子表面吸附 出处:《山东大学》2013年硕士论文 论文类型:学位论文
【摘要】:随着大规模计算的需求不断增长,并行计算技术得到了不断发展,TOP500每年都要公布峰值速度前500强的世界高性能计算机排名。现在主流高性能计算机的体系结构发展趋势,是使用基于共享存储的刀片多核处理器搭建机群系统,山东大学高性能机群便是采用这种架构。在并行计算机发展日新月异的同时,并行计算的实际应用发展速度大大落后于硬件的发展速度,应用程序实测性能远低于计算峰值。因此,充分利用起并行计算机的计算特点,优化提升应用的并行性能,比如对高分子表面吸附的并行应用进行优化,使其在机群上实现并行计算,并且提升并行性能缩短计算周期,成为了并行计算中的一项研究课题。 键涨落模型是高分子表面吸附数值模拟的经典运动模型,由于其计算量巨大使得单机PC进行计算模拟的时间不可接受,而MPI实现的并行蒙特卡洛抽样方法可以通过扩展PC(或计算核)的个数来计算不同的样本,最后将数据归约计算,当使用480核计算960样本时,将需要9年完成的串行计算加速至5天完成。这种粒度划分最小为每一个样本为一个计算任务,但当模拟的高分子链分子量比较大时,一个独立样本的计算时间也是相当长的。因此在MPI并行基础之上,可以通过区域分解进一步划分并行粒度,区域分解之后的循环迭代易于使用OpenMP提供的编译制导并行化。相比于MPI使用进程通信,OpenMP基于多线程技术,能更好的发挥刀片结点共享存储的优势。使用OpenMP直接并行化的应用程序,可以初步完成在刀片结点上的并行计算,但高效率的发挥并行性能,需要进一步测试、分析、调优,然后得到最合理的硬件资源使用方案。 本文基于高分子表面吸附在高性能机群上的MPI并行编程框架,主要工作分为两部分:首先,研究OpenMP编程技术,实现应用热点模块的并行化;其次,研究OpenMP的优化技术,针对高分子表面吸附应用设计并行优化方案。本文对高分子表面吸附应用的OpenMP程序调优工作,均在四路八核刀片上完成,测试结果表明优化方案能有效地提高实际并行性能。本文采用的软件工程优化化方法,可以为将来机群应用在单个结点上的OpenMP调优提供方法、经验和借鉴。具体而言,本文的主要工作如下: 1.给出MPI并行后的高分子表面吸附在高性能机群上的性能测试和分析,验证满足Gustafson定律; 2.在计算长链并行性能提升达到瓶颈的条件下,本文基于长链分段的方法,使用多线程模拟各段内的键涨落运动,以此来替代长链运动的方法。使用OpenMP并行编程实现并行接口MC_Bond_Fluc,完成在四路八核刀片上的性能测试; 3.设计了高分子表面吸附基于键涨落模型数值模拟的OpenMP优化方案,基于软件优化方法论,使用均衡负载、减少并行开销、合理使用内存、提高Cache命中等手段增量式优化,测试得到了性能最佳的OpenMP优化方式,给出高分子表面吸附的OpenMP并行最优方案。
[Abstract]:With the growing demand of massive computing, parallel computing technology has been developing continuously, TOP500 announced every year ranked high performance computer peak speed of the top 500. Now the mainstream architecture of high performance computer trend is the use of shared storage blade build multi-core cluster based on high performance cluster is Shandong University the architecture of the parallel computer. The development change rapidly at the same time, the development speed of parallel application development speed calculation greatly behind the hardware application, the measured performance is much lower than the calculated peak. Therefore, making full use of computing characteristics of parallel computer, optimized to enhance the performance of parallel applications, such as the parallel application of polymer surface adsorption the optimization of parallel computing in cluster, and improve the performance of parallel shorten computing period, and become A research topic in line calculation.
Bond fluctuation model is a classical model of numerical simulation of adsorption of the polymer surface, because of its large amount of computation makes the single PC was used to simulate the time is not acceptable, and MPI parallel Monte Carlo sampling method can be achieved by extending the PC (or the core) the number of calculation of different samples, and finally the data reduction calculation, when the use of 480 nuclear calculation of 960 samples, and will take 9 years to complete the serial computing speeds up to 5 days to complete. The minimum granularity for each sample as a computing task, but the molecular polymer chain when simulation is large, an independent sample of computing time is quite long. Therefore in MPI parallel basis, can be further divided by parallel granularity domain decomposition, iterative domain decomposition after parallelization using easy to compile guidance provided by OpenMP. Compared with MPI using the process of communication, OpenMP Based on multi threading technology, can better play the advantages of shared memory blade node. Using the OpenMP parallel application programs, can achieve simple parallel computing in blade nodes, but efficient use of parallel performance, the need for further testing, analysis, optimization, and then get the most rational use of hardware resources.
In this paper, the polymer surface adsorption in high performance cluster on the MPI parallel programming framework based on the main work is divided into two parts: first, study OpenMP programming technology and Realization of parallel applications module; secondly, optimization technology of OpenMP, the adsorption of polymer surface with parallel design optimization scheme. The OpenMP program optimization on adsorption the application of polymer surface, was completed in four road eight nuclear blade, test results show that the optimization scheme can effectively improve the parallel performance. This paper uses the software engineering optimization method can provide a method for the OpenMP optimization application on cluster's node, and learn from experience. Specifically, the main work of this paper the following:
1. the performance test and analysis of the polymer surface adsorbed on the high performance cluster after MPI parallel are given to verify the Gustafson law.
2. in the calculation of long chain parallel performance to reach the bottleneck conditions, this method of long chain segment based, multi thread is used to simulate bond fluctuation motion within each segment, in order to replace the method of long chain movement. The use of OpenMP to achieve the parallel interface of MC_Bond_Fluc parallel programming, complete performance testing in the four nuclear Road eight on the blade;
3. the design of the polymer surface adsorption of OpenMP optimization scheme for numerical simulation of bond fluctuation model based on the methodology of software optimization based on the use of load balancing, reduce overhead, reasonable use of memory, improve the Cache hit means of incremental optimization, OpenMP optimization test and got the best performance, given the polymer surface adsorption of OpenMP parallel optimal solution.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP338.6
【共引文献】
相关期刊论文 前10条
1 关亚林;曾艳奇;逯贵祯;;基于并行计算环境的混波室三维仿真[J];中国传媒大学学报(自然科学版);2008年03期
2 程克非;罗江华;李红波;;一种新的基于HPM并行计算性能数据采集方法[J];重庆邮电大学学报(自然科学版);2011年01期
3 王结臣;王豹;胡玮;张辉;;并行空间分析算法研究进展及评述[J];地理与地理信息科学;2011年06期
4 阮定益;;并行式matlab平台搭建[J];电脑知识与技术;2008年08期
5 胡海峰;;树状成本估算模型的并行处理[J];电脑知识与技术;2009年28期
6 古奋飞;王良侠;;浅析Linux集群技术[J];电脑知识与技术;2010年06期
7 古奋飞;王良侠;张莉;;基于Linux集群的高性能低成本的校园网解决方案[J];电脑知识与技术;2012年02期
8 李焱;胡祥云;金钢燮;吴桂桔;廖国忠;王程;;基于MPI的一维大地电磁并行计算研究[J];地球物理学进展;2010年05期
9 李焱;胡祥云;吴桂桔;叶益信;廖国忠;;基于MPI的二维大地电磁正演的并行计算[J];地震地质;2010年03期
10 刘晓群;邹欣;范虹;;基于并行云计算模式的建筑结构设计[J];电子技术应用;2011年10期
相关会议论文 前7条
1 肖永浩;黄清南;;基于分块数据结构的冲击问题并行计算[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
2 李根;李连崇;唐春安;唐世斌;王振;;岩石流固/热固作用下损伤演化并行分析系统及应用[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
3 张亚林;吴锦龙;李于锋;赵晓平;;PANDA软件框架的应用模板研究[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
4 董延华;张晔;白文秀;;影响基于PC集群系统的因素研究[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
5 武艳强;江在森;杨国华;;最小二乘配置方法在提取GPS时间序列信息中的应用[A];GPS技术应用研究论文专辑[C];2007年
6 张志敏;梁逸曾;王家俊;;并行交互检验方法及其在近红外光谱中的应用[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
7 程煜峰;徐幼平;普业;;并行计算在数值预报模式中的应用[A];第28届中国气象学会年会——S17第三届研究生年会[C];2011年
相关硕士学位论文 前10条
1 朱圣鑫;并行GPBiCG(m,,l)算法与预处理技术[D];中国工程物理研究院;2010年
2 兰任;基于并行混合粒子群算法的蛋白质结构预测[D];大连理工大学;2010年
3 高和东;GPU并行计算在LSSVM建模中的研究与应用[D];大连理工大学;2010年
4 张晶;ABEEMσπ/MM模型中能量求解的并行化[D];辽宁师范大学;2010年
5 田野;环境卫星光学影像自动配准算法研究与并行实现[D];辽宁工程技术大学;2009年
6 罗r
本文编号:1607195
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1607195.html