基于众核架构的并行SPH算法的研究与实现
本文选题:光滑粒子动力学 + 流体运动 ; 参考:《上海交通大学》2013年硕士论文
【摘要】:流体运动现象是周围环境的一个重要组成部分,对该现象在计算机上快速的模拟仿真,是航空航天、海洋船舶等许多行业领域所迫切需要的。目前对混合介质的流体运动模拟较为理想的方法是光滑粒子动力学(SPH)方法,它是一种无网格的纯Lagrange方法,以粒子理论为基础,通过计算整合各个粒子的状态来得到整个流场运动的规律。但是该方法在实际应用时需要用到大量的计算,以至于模拟速度缓慢。至今为止,已有一些在SPH并行方法上的研究成果,但大部分实现模型过于简化或者仅将部分算法移植到GPU上实现,未能充分利用GPU的计算能力。 本文首先对SPH方法的串行程序代码做了详细分析,了解该算法的具体流程。同时对算法中的两个关键步骤(相邻粒子对构建以及粒子属性值计算)做了深入研究,归纳整合出了具体的执行过程。然后通过对串行代码的热点分析,找到程序性能瓶颈所在,寻找方法加以改善。为充分利用GPU众核架构强大的计算能力,作者对SPH的并行算法的实现主要做了如下几点贡献: 将SPH算法的整体过程,包括相邻粒子对构建以及粒子物理属性值计算,移植到GPU众核架构上实现 在相邻粒子对存储过程中,利用对存储空间下标的原子操作,代替使用临界区锁定整个存储空间,实现存储器的写并行,加快模拟速度。 在粒子属性值计算过程中,利用共享存储器作为中间变量减少对全局存储器的访问次数,,加速计算过程。 利用不同线程维度,以及对GPU资源使用的分析找到最合适的并行粒度,取得最佳性能。 在本文实验中,我们使用CUDA作为GPU的编程语言。在性能测试对比实验中,分别使用NVIDIA Tesla C2050以及NVIDIA Tesla K20分别作为GPU硬件设备,进行并行算法性能测试,使用Intel至强CPU W3520进行串行算法的性能测试。将并行程序的性能与串行程序作对比得到加,使用C2050GPU单卡加速可以取得相对于串行程序8倍的加速比,而使用K20GPU显卡可以取得20倍的加速比。
[Abstract]:The phenomenon of fluid motion is an important part of the surrounding environment. The rapid simulation of the phenomenon on the computer is urgently needed in many fields, such as aerospace, ocean and ship. At present, the ideal method for fluid motion simulation in mixed media is smooth particle dynamics (SPH) method, which is a meshless pure Lagrange method based on particle theory. The motion of the whole flow field is obtained by calculating the state of the integrated particles. However, this method needs a lot of calculation in practical application, so the simulation speed is slow. Up to now, there have been some research results on SPH parallel methods, but most of the implementation models are too simplified or only some algorithms are transplanted to GPU, so they can not make full use of the computing power of GPU. In this paper, the serial program code of SPH method is analyzed in detail, and the flow of the algorithm is understood. At the same time, the two key steps in the algorithm (the construction of adjacent particle pairs and the calculation of particle attribute values) are deeply studied, and the concrete execution process is summarized and integrated. Then, by analyzing the hot spot of serial code, we find the bottleneck of program performance and find ways to improve it. In order to make full use of the powerful computing power of the GPU multi-core architecture, the author has made the following contributions to the implementation of the parallel algorithm of SPH: The whole process of SPH algorithm, including the construction of adjacent particle pairs and the calculation of particle physical attribute values, is transplanted to the GPU multi-kernel architecture. In the storage procedure of adjacent particle pairs, the atomic operation of subscript to storage space is used instead of locking the entire storage space in the critical region to realize the memory write parallelism and speed up the simulation. In the process of calculating the particle attribute value, the shared memory is used as the intermediate variable to reduce the number of visits to the global memory, and the calculation process is accelerated. Using different thread dimensions and analyzing the usage of GPU resources, the most suitable parallel granularity is found and the best performance is obtained. In our experiment, we use CUDA as the programming language of GPU. In the performance test contrast experiment, NVIDIA Tesla C2050 and NVIDIA Tesla K20 are used as GPU hardware devices to test the performance of parallel algorithm, and Intel to strong CPU W3520 are used to test the performance of serial algorithm. By comparing the performance of parallel program with serial program, the speedup ratio of 8 times that of serial program can be obtained by using C2050GPU single card acceleration, and 20 times speed ratio can be obtained by using K20GPU graphics card.
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP338.6
【相似文献】
相关期刊论文 前10条
1 占炜;;用VB 6.0实现简单数字组合算法程序[J];电脑知识与技术(学术交流);2007年07期
2 胡启敏;薛锦云;;若干算法程序的形式化推导与生成技术研究[J];计算机研究与发展;2008年S1期
3 ;ATI联手华硕推显卡芯片[J];每周电脑报;2003年39期
4 付军;;IDT要做网络通信领域的领导者[J];集成电路应用;2004年11期
5 ;Silicon Image公布低成本储存架构,面向小业务用户[J];集成电路应用;2004年12期
6 刘东;周明天;;一种文本数字水印系统解决方案[J];计算机应用;2006年01期
7 ;英特尔芯片将采用新一代微架构[J];每周电脑报;2006年08期
8 李中友;;中小型民营电路板企业管理四步曲[J];印制电路信息;2006年02期
9 曹平;郑朔f ;;基于Web Service的航空基础数据库应用体系架构探索[J];航空标准化与质量;2006年02期
10 翁惠明;;财政核心业务应用系统架构研究[J];机电技术;2006年02期
相关会议论文 前10条
1 张大华;丁辉;吴向阳;赵毅强;孙毓忠;;面向智能电网的电力云计算架构[A];2011电力通信管理暨智能电网通信技术论坛论文集[C];2011年
2 肖晴;;移动互联网业务“云+端”架构的探索与实践[A];中国通信学会信息通信网络技术委员会2011年年会论文集(上册)[C];2011年
3 顾建国;朱光荣;;基于全台网架构的“大媒资”系统设计及实践[A];2011中国电影电视技术学会影视技术文集[C];2011年
4 潘建;;核物理装置计算机控制系统的架构选择与比较[A];第十五届全国核电子学与核探测技术学术年会论文集[C];2010年
5 石海鹤;薛锦云;;一种基于PAR的高可靠算法程序设计技术[A];第六届中国测试学术会议论文集[C];2010年
6 赵树璋;;SaaS架构现状及发展趋势[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
7 段志其;谭登清;杨亚明;;B/S架构编程在煤矿企业信息化中的应用[A];煤矿自动化与信息化——第21届全国煤矿自动化与信息化学术会议暨第3届中国煤矿信息化与自动化高层论坛论文集(下册)[C];2011年
8 杨亚明;宗昆昆;;B/S架构编程在煤矿企业信息化中的应用[A];煤炭机电与自动化实用技术[C];2012年
9 许威;朱顺痣;缪克华;王颖;李茂青;;同步/异步ETL架构的比较[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 邱奎宁;杨晓波;;一种开放的项目信息管理系统架构[A];工程三维模型与虚拟现实表现——第二届工程建设计算机应用创新论坛论文集[C];2009年
相关重要报纸文章 前10条
1 本报记者 周源;共享IT架构选购之道[N];网络世界;2010年
2 本报记者 邹大斌;QNX:微内核架构奠定安全基础[N];计算机世界;2011年
3 《网络世界》记者 于翔;混合交付:云只是途径之一[N];网络世界;2011年
4 本报记者 赵谨娜;IBM X架构:技术为本 用户为先[N];中国计算机报;2001年
5 记者 于新春;业内人士呼吁建立新型市场架构[N];国际商报;2001年
6 刘杰;思杰陶欣:绿色IT架构要“瞻前顾后”[N];中国企业报;2010年
7 拉毛东治 李婷;青海公司SG—ERP架构管控项目开建[N];国家电网报;2011年
8 记者 韩晓民;深圳架构城区统一信息平台[N];人民邮电;2001年
9 赵海军;X-架构抢先机[N];中国计算机报;2002年
10 马克·马多克期 剑桥大学社全球首席信息官;传统出版社迫切需要构建技术企业架构[N];中国图书商报;2010年
相关博士学位论文 前10条
1 杨鹏;居民电子健康档案文档架构与数据元组的研究与实践[D];第四军医大学;2012年
2 陈海舟;不可压自由表面流的SPH法数值模拟研究[D];天津大学;2009年
3 龚凯;基于光滑质点水动力学(SPH)方法的自由表面流动数值模拟研究[D];上海交通大学;2009年
4 崔巍;虚拟企业伙伴选择与业务过程建模方法研究[D];山东大学;2009年
5 曲世军;中国房地产金融风险判断及防范体系架构研究[D];东北师范大学;2008年
6 朱强;基于对等网络架构的新型控制系统研究与实现[D];上海大学;2011年
7 张学全;基于FPGA的星载图像压缩系统实现方法研究[D];中国科学院研究生院(空间科学与应用研究中心);2009年
8 郑俊;SPH基本问题研究及其在高速水下物体流场模拟中的应用[D];哈尔滨工业大学;2010年
9 张蓉;结构化对等计算机系统中的查询处理[D];复旦大学;2007年
10 王超;异构多核可重构片上系统关键技术研究[D];中国科学技术大学;2011年
相关硕士学位论文 前10条
1 徐锋;基于众核架构的并行SPH算法的研究与实现[D];上海交通大学;2013年
2 杨国英;基于B/S模式的高校仪器设备管理信息系统的设计与实现[D];北京化工大学;2005年
3 张爱红;基于Web服务的共建共享型数字图书馆研究[D];四川大学;2005年
4 阙宇峻;面向系统芯片的软硬件协同设计平台VXP(Virtual Executable Platform)的设计[D];华东师范大学;2006年
5 李明;J2EE核心模式及其在低压配电信息系统中的应用研究[D];华中科技大学;2005年
6 张涛;软件开发过程的工作流管理系统[D];天津大学;2005年
7 李尚华;中外足球市场体系架构对比研究[D];武汉体育学院;2008年
8 王治国;行政诉讼调解制度研究[D];苏州大学;2007年
9 池烨;数字家庭网关上的QoS架构与算法研究[D];上海交通大学;2010年
10 陈阳;基于SPH算法的程序设计及其在成型装药战斗部中的应用[D];中北大学;2012年
本文编号:1847928
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1847928.html