当前位置:主页 > 科技论文 > 物理论文 >

基于异构计算的三维FDTD并行算法及其在电磁仿真中的应用

发布时间:2019-11-10 17:41
【摘要】:时域有限差分(FDTD)法是求解电磁学中麦克斯韦方程组的重要方法之一,一直以来获得了广泛的使用,但是应用于电大尺寸目标仿真时存在巨大的耗时问题。为解决这一问题,利用图形处理器(GPU)的并行处理特性,结合计算统一设备架构(CUDA),以低通滤波器为算例,实现了时域卷积理想匹配层(CPML)吸收边界的三维FDTD高性能加速计算,目标网格数达5百万。实验在Fermi架构的Quadro 4000和Tesla M2050两款GPU上实测,误差均在10~(-4)范围内,相对于同时期的CPU分别可获得36和55倍以上的加速,结果表明该方法具有精度高、效率高、通用性和实用性强等特点。
【图文】:

网格图,网格,共享内存,线程


Yee网格在三维空间中与其他六个网格相邻,如图1所示。位于棱边的电场值由四个Yee网格共享,位于网格面中心的磁场值由两个Yee网格共享。Figure1YeegridoftheFDTDalgorithm图1FDTD算法的Yee网格CUDA编程模型的grid善于处理二维数据,而需要求解的电磁目标为三维结构。本文采用了最直接的切片方法(SlicingMethod)将三维空间映射到二维,并以点构成面,以面构成体的方式来实现三维结构的仿真。如图2所示,线程与三维空间中的Yee单元在位置上一一对应,x对应实际空间中的j,y对应k,并在jk平面递增。线程所计算的点在同一个平面,相邻的多个平面就组成了三维物理空间,便于完成三维电磁场仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads图2Yee网格与CUDA线程的对应关系为了提高全局存储器的访存效率,本文对切片每一层都用CudaMallocPitch函数分配冗余存储空间。Fermi计算架构64KB的片上存储器可以配置成48KB的共享内存和16KB的L1Cache,也可以配置成16KB的共享内存和48KB的L1Cache。由于共享内存需要显式的代码实现,因此,本文采用低代价的L1Cache来提高数据访问命中率。之前的尝试也证实了采用共享内存相对于采用L1Cache并没有提升算法性能。3.2FDTD算法实现流程图对于整个算法流程,计算机采用异构架构,GPU以协处理器的方式与CPU协同工作,程

流程图,线程,对应关系,网格


维结构。本文采用了最直接的切片方法(SlicingMethod)将三维空间映射到二维,并以点构成面,以面构成体的方式来实现三维结构的仿真。如图2所示,线程与三维空间中的Yee单元在位置上一一对应,x对应实际空间中的j,y对应k,并在jk平面递增。线程所计算的点在同一个平面,相邻的多个平面就组成了三维物理空间,便于完成三维电磁场仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads图2Yee网格与CUDA线程的对应关系为了提高全局存储器的访存效率,本文对切片每一层都用CudaMallocPitch函数分配冗余存储空间。Fermi计算架构64KB的片上存储器可以配置成48KB的共享内存和16KB的L1Cache,也可以配置成16KB的共享内存和48KB的L1Cache。由于共享内存需要显式的代码实现,因此,本文采用低代价的L1Cache来提高数据访问命中率。之前的尝试也证实了采用共享内存相对于采用L1Cache并没有提升算法性能。3.2FDTD算法实现流程图对于整个算法流程,计算机采用异构架构,GPU以协处理器的方式与CPU协同工作,程序的流程图如图3所示。主机端主要负责物理目标以及集总参数电路建模、模型媒质参量初始化、内存分配、媒质网格剖分、场量和更新系数初始化,,将内存中计算所用的三维电磁场数据变量等传递到显存,激活内核进行电磁场加速仿真,并维持电磁场在时间上的推进。设备端执行核函数,更新场域,完成全局场域以及CPML区域的场值计算。由2

【相似文献】

相关期刊论文 前5条

1 许桢;;关于CPU+GPU异构计算的研究与分析[J];科技信息;2010年17期

2 金滔,徐炜民;网络并行方式的PVM异构计算环境[J];上海大学学报(自然科学版);1996年02期

3 曾国荪,周定康,黄明和;异构计算开发最大循环并行性(英文)[J];江西师范大学学报(自然科学版);2000年04期

4 鱼滨,华庆一;基于CORBA的分布式异构计算环境的分析与实践[J];西北大学学报(自然科学版);2000年02期

5 ;[J];;年期

相关会议论文 前2条

1 陈虎;陈思桐;李观钊;罗伟良;甄真;张林亚;干芸芸;赖路双;奚建清;;异构计算平台上列存储数据库的并行查询技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

2 林新华;顾一众;;上海交通大学高性能计算建设理念与实践[A];中国高等教育学会教育信息化分会第十二次学术年会论文集[C];2014年

相关重要报纸文章 前9条

1 本报记者 霍光;走出异构计算的认识误区[N];中国计算机报;2009年

2 本报记者 霍光;异构计算两大引擎再次加速[N];中国计算机报;2009年

3 ;计算:从工作到生活[N];中国计算机报;2010年

4 姑苏飘雪;异构计算,PC效率的提升之道[N];电脑报;2012年

5 本报记者 李万予;Altera披露新异构计算核心[N];中国计算机报;2013年

6 本报记者 王星;异构计算引领软件开发创新[N];电脑报;2012年

7 本报记者 霍光;计算未来[N];中国计算机报;2012年

8 ;“芯”融聚 谋未来[N];中国电脑教育报;2011年

9 李映;MIPS能否从“芯”再出发[N];中国电子报;2012年

相关博士学位论文 前1条

1 张丹;面向异构体系结构的任务流化技术研究[D];解放军信息工程大学;2012年

相关硕士学位论文 前10条

1 范兴山;基于异构计算的矩阵广义逆算法研究及实现[D];电子科技大学;2014年

2 蒲宇亮;基于异构计算系统的图像信息提取关键算法研究与实现[D];电子科技大学;2016年

3 彭玉炳;基于异构计算的CNN并行框架的设计与实现[D];电子科技大学;2016年

4 纪剑雄;基于异构计算系统中动态任务分配的蜂群算法研究[D];华东师范大学;2008年

5 周斯波;异构计算环境下的地图代数空间分析并行方法研究[D];中国地质大学;2013年

6 朱伟;异构计算环境下高性能网络模拟任务划分[D];江南大学;2014年

7 张胜辉;基于FPGA加速的异构计算多结点系统实时硬件任务调度与管理[D];华东交通大学;2013年

8 何东阳;适用异构计算环境中监控软件系统的研究与实践[D];东华大学;2012年

9 周子航;基于OpenCL异构计算的数学图像绘制[D];广州大学;2013年

10 江文;异构计算环境下任务调度算法的研究[D];湖南大学;2010年



本文编号:2558968

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wulilw/2558968.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e8772***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com