当前位置:主页 > 科技论文 > 计算机论文 >

基于N-S方程的气体静压润滑流场GPU并行算法研究

发布时间:2020-07-15 05:58
【摘要】:近年来,随着计算机技术和气体润滑技术的迅速发展,该领域所研究的问题不断扩展和深化,使得目前计算机的单机性能已经无法满足计算需求,采用并行方法求解这类问题显得尤为重要。为了探究GPU并行算法的实现原理,本文先对GPU的基本结构和特性进行研究,分析了CFD程序在GPU上的实现过程和执行方式,并设计了一套求解N-S方程的GPU并行算法。针对该算法,利用CUDA技术实现超音速平板流动算例的GPU并行计算,以此来验证算法的可行性和正确性,并对流场的计算结果和程序加速比进行探讨。在GPU并行算法成功实现的基础上,本文对气体静压润滑流场的串行程序进行重构,实现流场的GPU并行计算,通过雷诺方程验证了GPU并行程序的正确性,并对流场的计算结果进行详细分析。此外,通过几种优化方法,实现了GPU并行计算程序的性能优化,文中主要采用的优化方法有:对GPU中全局存储器和共享存储器的访问优化、对主机与设备间数据传输的优化以及对GPU指令集的优化。本文主要设计了一套适用于CFD计算程序的GPU并行算法,应用该算法分别求解了超音速平板流动算例和气体静压润滑流场计算程序,并通过几种优化方法,对GPU并行程序进行性能优化。结果表明:GPU的计算速度明显比CPU要快;GPU与CPU的计算结果偏差较小,几乎可以忽略,在精度要求不是特别严格的情况下,完全可以采用GPU代替CPU进行数值计算;N-S方程的计算结果捕捉到雷诺方程无法计算得出的温度现象;在所有优化方法中,对GPU存储器的访问方式进行优化,属于较高层次的优化方法,取得的优化效果较为明显,其他几种属于较低层次的优化方法,取得的优化效果比较有限。
【学位授予单位】:西安工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:O35;TP332
【图文】:

处理器,参数,时钟频率,因特


re)的图形处理单元(Graphic Process Unit,简称 GPU)方向[4]。因特尔(intel)公司自主研发的酷睿(Core)系列处理器,其最i9-9900K 处理器[5],内核时钟频率已经达到了 3.6GHz,但是受能耗在现有架构上单核心 CPU 的时钟频率已经很难提高,该 CPU 的 所示。

对比图,运算能力,对比图,数理


同时期 CPU 与 GPU 单精度浮点数理论计算峰值对比图[8],图终高于 CPU,2016 年两者的计算差距甚至达到了一个数量级因是两者的架构完全不同,GPU 所拥有的计算核心数远多于

参数,旗舰,点运算,数理


达(NVIDIA)公司 2017 年年中发布的旗舰级计算显卡 Tesla V达到了 5120 个,单精度浮点数理论计算峰值为每秒 14 万亿次(图 1.3 所示。与上文提到的 intel Core i9 系列 CPU 相比,无论是点运算能力,都有较大差距。

【相似文献】

相关期刊论文 前10条

1 陈国良;孙广中;徐云;吕敏;;并行算法研究方法学[J];计算机学报;2008年09期

2 陈国良;昔日王榭堂前燕,飞入寻常百姓家浅谈并行算法[J];新电脑;2002年12期

3 方同祝;并行算法在系统仿真中的应用[J];微机发展;1999年04期

4 寿标,李晓峰;更实际的并行算法的设计[J];计算机研究与发展;1996年06期

5 韩晓言,韩祯祥;预处理并轭梯度法在电力系统暂态稳定分析并行算法中的应用研究[J];电力系统及其自动化学报;1996年02期

6 李庆华,陆枫;使用《并行算法的设计与分析》一书作教材的体会[J];教育与现代化;1996年03期

7 张朝阳,王海期,孙炳楠,唐锦春;多跨输电线平面振动特性的并行算法[J];华中理工大学学报;1997年04期

8 许丹柯;;并行计算机选型及并行算法评估[J];石油工业计算机应用;1994年02期

9 王川龙,郭耀鹏;H-分裂与并行算法[J];工程数学学报;1995年03期

10 朱方生;线性二次型最优控制的并行算法和软件[J];武汉大学学报(自然科学版);1995年03期

相关会议论文 前10条

1 焦龙;郭亚红;纪守领;李金宝;;基于多核计算机的分子动力学并行算法的实现[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

2 姚向东;;并行算法到并行结构的映射[A];中国工程物理研究院科技年报(2001)[C];2001年

3 王轶;席裕庚;;自适应极点配置器设计中的并行算法[A];1994中国控制与决策学术年会论文集[C];1994年

4 高华;苗世光;;城市小区尺度模式并行算法研究[A];中国气象学会2006年年会“中尺度天气动力学、数值模拟和预测”分会场论文集[C];2006年

5 张衡;张武;;三维抛物型初边值问题的块三对角可扩展并行算法[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年

6 樊洪明;李先庭;赵彬;任鸿泽;;有限元分布式并行算法研究[A];全国暖通空调制冷2002年学术年会论文集[C];2002年

7 王雷章;张爱武;刘晓萌;;三维建模中平面分割并行算法的设计与实现[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年

8 陈平;乔秀全;刘臻;田小萍;;数据挖掘网格中决策树并行算法设计及性能分析[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年

9 林伟军;王秀明;张海澜;;弹性波在非均匀各向异性介质中的传播模拟及其并行算法[A];2004年全国物理声学会议论文集[C];2004年

10 邓力;张文勇;刘杰;许海燕;王瑞宏;李树;;非定常粒子输运蒙特卡罗并行算法研究[A];中国工程物理研究院科技年报(2003)[C];2003年

相关重要报纸文章 前10条

1 ;并行算法研究进展[N];中国计算机报;2004年

2 新华社记者 奚启新 本报通讯员 李汛 记者 喻国英;精彩人生[N];光明日报;2005年

3 新华社记者 奚启新 本报记者 廖文根;三次选择 无怨无悔[N];人民日报;2005年

4 记者 温婷;中国超算再度登顶全球500强[N];上海证券报;2016年

5 ;名师上讲台:每堂课都是精心编排的演出[N];科技日报;2006年

6 宋宇;高性能计算面临三大难题[N];中国计算机报;2000年

7 本报记者 赵波 本报特约记者 刘程 本报通讯员 章立丁;一位巾帼学者的无悔征程[N];解放军报;2005年

8 宋家雨;混合型高性能计算落户深圳[N];网络世界;2007年

9 清华大学计算机系 薛巍;电网仿真考验高性能计算[N];计算机世界;2006年

10 陈文光 郑纬民;高性能计算的三大研究领域[N];计算机世界;2006年

相关博士学位论文 前10条

1 张加乐;面向求解三维复杂流动问题的GPU并行算法及其应用研究[D];南京航空航天大学;2018年

2 周毅;多核CPU/众核GPU加速的并行优化算法研究[D];武汉大学;2016年

3 潘斌;几何定理机器证明并行算法研究[D];中国科学院研究生院(成都计算机应用研究所);2006年

4 曾清红;无网格数值模拟的并行算法及并行实现研究[D];中国科学技术大学;2006年

5 杜云飞;容错并行算法的研究与分析[D];国防科学技术大学;2008年

6 雷国庆;基于FPGA的图计算并行算法和体系结构研究[D];国防科学技术大学;2015年

7 李雪宝;太阳望远镜海量数据并行处理技术研究[D];中国科学院研究生院(云南天文台);2015年

8 邬贵明;FPGA矩阵计算并行算法与结构[D];国防科学技术大学;2011年

9 廖臣;三维电磁粒子模拟并行算法及其应用研究[D];电子科技大学;2010年

10 李鸿健;并行算法在激光化学反应模拟中的应用研究[D];电子科技大学;2012年

相关硕士学位论文 前10条

1 姜庆郁;基于GPU并行算法的扩展多面体DEM-SPH流-固耦合数值模拟[D];大连理工大学;2019年

2 王永振;基于N-S方程的气体静压润滑流场GPU并行算法研究[D];西安工业大学;2019年

3 邓大博;基于Spark计算框架下的带容量约束的车辆路径问题并行算法研究[D];厦门大学;2017年

4 王晟;基于CUDA平台的有限元单元级别并行算法研究[D];沈阳工业大学;2019年

5 刘晓东;三维结构热仿真并行算法研究及软件设计[D];上海交通大学;2017年

6 元润一;基于深度学习的检测与分割并行算法研究[D];吉林大学;2019年

7 段素霞;二维中子输运问题的特征线并行算法研究[D];国防科学技术大学;2017年

8 任沂斌;高性能集群下LiDAR数据生成DEM并行算法研究[D];南京大学;2015年

9 洪文杰;基于申威处理器的PETSc异构并行算法设计和研究[D];湖南大学;2018年

10 赵涛;一种三维非定常线弹性问题的自适应并行算法[D];湘潭大学;2018年



本文编号:2756081

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2756081.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0a42b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com