当前位置:主页 > 科技论文 > 电气论文 >

基于CUDA平台的有限元单元级别并行算法研究

发布时间:2020-09-25 17:21
   对于大型工程电磁场的分析,存在着诸如电力设备整体尺寸过大而铁磁材料电磁场透入深度很小的多尺度问题、电磁特性的非线性且各向异性问题使得电磁场数值计算规模过大。采用常规串行有限元法会出现计算时间过长,计算结果误差大的问题,有时甚至无法进行计算。因此,有限元并行算法将成为研究的热点。GPU是专为密集型、高度并行化的计算而设计的可编程流处理器,其众核性质能够为单元级别并行计算提供保障。本文研究了一种单元级别的有限元并行算法(EBE-PFEM)并将其在CUDA平台上并行实现。本文推导了EBE(element-by-element)有限元法的数学模型,并给出了第一类边界条件的EBE处理,研究了基于EBE策略的共轭梯度(EBE-CG)法。为了改善共轭梯度法的收敛性,本文使用的是雅克比(Jacobi)预处理技术,并对基于EBE策略的Jacobi预处理共轭梯度(EBE-J-PCG)法进行了推导,并给出具体迭代过程。为发挥EBE有限元法并行度高的优势,研究基于CUDA平台的GPU硬件结构及指令执行特点,将结合Jacobi预处理技术的EBE-J-PCG方法在CUDA平台上并行实现,给出了基于CUDA平台的EBE-J-PCG方法的CPU-GPU协同计算模型,并用C++语言编制了相应的程序。通过与长直载流导体空间磁场解析解的比较,验证了算法与程序的正确性。最后,分别在CPU平台和CUDA平台上使用EBE-CG方法和结合Jacobi预处理的EBE-J-PCG方法求解一台单相电力变压器和三相感应电机的主磁场分布。在计算精度相同的情况下,采用Jacobi预处理技术能够提高算法的收敛性;相比于只在CPU平台上运行的EBE有限元分析,基于CUDA平台的EBE有限元并行计算获得了更高的计算效率,并且计算规模越大,加速比越高。该方法可用于大型电力设备的大规模数值计算。
【学位单位】:沈阳工业大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TM15
【部分图文】:

网格剖分,联系矩阵


沈阳工业大学硕士学位论文14图2.1 网格剖分图Fig. 2.1 Mesh subdivision以单元(1)为例,该单元的单元系数矩阵为:(1) (1) (1)11 12 14(1) (1) (1) (1)21 22 24(1) (1) (1)41 42 44= A A AA A A AA A A(2.25)单元(1)的系数矩阵对总体系数矩阵的贡献为:(1) (1) (1)11 12 14(1) (1) (1)21 22 24(1)(1) (1) (1)41 42 430 0 00 0 00 0 0 0 0 0 =0 0 00 0 0 0 0 00 0 0 0 0 0 A A AA A AAA A A(2.26)由节点联系矩阵的特点能够得到单元(1)的节点联系矩阵,具体形式如下:(1)1 0 0 0 0 0= 0 1 0 0 0 00 0 0 1 0 0 Q (2.27)同理可得,其余三个单元的节点联系矩阵(2)Q ,(3)Q ,(4)Q 的具体形式,根据公式(2.17)得到总体联系矩阵 Q。以单元(1)为例,节点变量?

架构图,架构


通过 PCI-E 总线将其与 CPU 相连才能够进行工作。它在显卡中发挥着是显卡中必不可少的一部分。不同的 GPU 架构的设计理念、工艺水平的结构和性能也不一样。不同的架构拥有不同的计算能力。接下来分U 的具体硬件特性。orce GTX-960M 采用的是基于 Maxwell 架构的 GM206 核心(如图 架构对流多处理器(Streaming Multiprocessor,SM)进行了升级,变为处理器(如图 3.2)中包含了 128 个 CUDA 核心、32 个特殊功能单元 Unit,SFU)、32 个存取单元(load/store unites,LD/ST)、4 个指令分调度器和 4 个线程束调度器。即本文在此硬件架构下使用算法程序进行SM 上能够同时发送和执行 4 个线程束,能够在每个时钟内启动 8 架构由内存控制器、图形处理器簇(Graph Processing Cluster,GPC)、CI-E 接口构成。其中,每个 GPC 由一个光栅单元和 4 个 SMM 构成,PC。即本文进行并行计算时,能够同时执行 16 个流多处理器。

架构图,架构,代码


图3.2 SMM 架构Fig. 3.2 Architecture of SMM体系开发的基本软件环境由 CUDA 库函数(CUDA Library)、及行业标准程序语言的扩展(包括 C、C++、Fortran 等)构体系。CUDA C++是标准 ANSI C 语言的一个扩展,带有少程成为可能,同时也能通过 API 来管理设备、内存和其他任进行编译时,会将在 GPU 上运行的代码与 CPU 上运行的将在 GPU 上运行的代码编译为 PTX 代码,而在 CPU 上运行编译,并通过 C 文件的方式给出。CUDA 提供了 CUDAAPI 两层 API 来管理 GPU 设备和组织线程。在一个程序中只 CUDA driver API 的其中一种,本文使用的是 CUDA runtim

【相似文献】

相关期刊论文 前10条

1 陈国良;孙广中;徐云;吕敏;;并行算法研究方法学[J];计算机学报;2008年09期

2 陈国良;昔日王榭堂前燕,飞入寻常百姓家浅谈并行算法[J];新电脑;2002年12期

3 方同祝;并行算法在系统仿真中的应用[J];微机发展;1999年04期

4 寿标,李晓峰;更实际的并行算法的设计[J];计算机研究与发展;1996年06期

5 韩晓言,韩祯祥;预处理并轭梯度法在电力系统暂态稳定分析并行算法中的应用研究[J];电力系统及其自动化学报;1996年02期

6 李庆华,陆枫;使用《并行算法的设计与分析》一书作教材的体会[J];教育与现代化;1996年03期

7 张朝阳,王海期,孙炳楠,唐锦春;多跨输电线平面振动特性的并行算法[J];华中理工大学学报;1997年04期

8 许丹柯;;并行计算机选型及并行算法评估[J];石油工业计算机应用;1994年02期

9 王川龙,郭耀鹏;H-分裂与并行算法[J];工程数学学报;1995年03期

10 朱方生;线性二次型最优控制的并行算法和软件[J];武汉大学学报(自然科学版);1995年03期

相关会议论文 前10条

1 焦龙;郭亚红;纪守领;李金宝;;基于多核计算机的分子动力学并行算法的实现[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

2 姚向东;;并行算法到并行结构的映射[A];中国工程物理研究院科技年报(2001)[C];2001年

3 王轶;席裕庚;;自适应极点配置器设计中的并行算法[A];1994中国控制与决策学术年会论文集[C];1994年

4 高华;苗世光;;城市小区尺度模式并行算法研究[A];中国气象学会2006年年会“中尺度天气动力学、数值模拟和预测”分会场论文集[C];2006年

5 张衡;张武;;三维抛物型初边值问题的块三对角可扩展并行算法[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年

6 樊洪明;李先庭;赵彬;任鸿泽;;有限元分布式并行算法研究[A];全国暖通空调制冷2002年学术年会论文集[C];2002年

7 王雷章;张爱武;刘晓萌;;三维建模中平面分割并行算法的设计与实现[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年

8 陈平;乔秀全;刘臻;田小萍;;数据挖掘网格中决策树并行算法设计及性能分析[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年

9 林伟军;王秀明;张海澜;;弹性波在非均匀各向异性介质中的传播模拟及其并行算法[A];2004年全国物理声学会议论文集[C];2004年

10 邓力;张文勇;刘杰;许海燕;王瑞宏;李树;;非定常粒子输运蒙特卡罗并行算法研究[A];中国工程物理研究院科技年报(2003)[C];2003年

相关重要报纸文章 前10条

1 ;并行算法研究进展[N];中国计算机报;2004年

2 新华社记者 奚启新 本报通讯员 李汛 记者 喻国英;精彩人生[N];光明日报;2005年

3 新华社记者 奚启新 本报记者 廖文根;三次选择 无怨无悔[N];人民日报;2005年

4 记者 温婷;中国超算再度登顶全球500强[N];上海证券报;2016年

5 ;名师上讲台:每堂课都是精心编排的演出[N];科技日报;2006年

6 宋宇;高性能计算面临三大难题[N];中国计算机报;2000年

7 本报记者 赵波 本报特约记者 刘程 本报通讯员 章立丁;一位巾帼学者的无悔征程[N];解放军报;2005年

8 宋家雨;混合型高性能计算落户深圳[N];网络世界;2007年

9 清华大学计算机系 薛巍;电网仿真考验高性能计算[N];计算机世界;2006年

10 陈文光 郑纬民;高性能计算的三大研究领域[N];计算机世界;2006年

相关博士学位论文 前10条

1 潘斌;几何定理机器证明并行算法研究[D];中国科学院研究生院(成都计算机应用研究所);2006年

2 曾清红;无网格数值模拟的并行算法及并行实现研究[D];中国科学技术大学;2006年

3 杜云飞;容错并行算法的研究与分析[D];国防科学技术大学;2008年

4 雷国庆;基于FPGA的图计算并行算法和体系结构研究[D];国防科学技术大学;2015年

5 李雪宝;太阳望远镜海量数据并行处理技术研究[D];中国科学院研究生院(云南天文台);2015年

6 邬贵明;FPGA矩阵计算并行算法与结构[D];国防科学技术大学;2011年

7 廖臣;三维电磁粒子模拟并行算法及其应用研究[D];电子科技大学;2010年

8 李鸿健;并行算法在激光化学反应模拟中的应用研究[D];电子科技大学;2012年

9 吴超;信息检索中top-k问题的并行算法及优化研究[D];中国科学技术大学;2011年

10 杜刘革;基于多GPU的FDTD并行算法及其在电磁仿真中的应用[D];山东大学;2011年

相关硕士学位论文 前10条

1 王晟;基于CUDA平台的有限元单元级别并行算法研究[D];沈阳工业大学;2019年

2 邓大博;基于Spark计算框架下的带容量约束的车辆路径问题并行算法研究[D];厦门大学;2017年

3 段素霞;二维中子输运问题的特征线并行算法研究[D];国防科学技术大学;2017年

4 任沂斌;高性能集群下LiDAR数据生成DEM并行算法研究[D];南京大学;2015年

5 洪文杰;基于申威处理器的PETSc异构并行算法设计和研究[D];湖南大学;2018年

6 赵涛;一种三维非定常线弹性问题的自适应并行算法[D];湘潭大学;2018年

7 唐光平;基于三对角线性方程组的混合并行算法研究[D];湖南大学;2015年

8 聂双;综合孔径微波辐射计图像反演并行算法研究[D];华中科技大学;2017年

9 陈长吉;适用于深度学习的数据预处理并行算法实现及性能优化[D];上海海洋大学;2018年

10 许丹丹;CPU-GPU协同异构环境下卡尔曼滤波的并行算法研究[D];湖南大学;2017年



本文编号:2826848

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dianlidianqilunwen/2826848.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eb1cc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com