基于异构计算的三维FDTD并行算法及其在电磁仿真中的应用
【图文】:
Yee网格在三维空间中与其他六个网格相邻,如图1所示。位于棱边的电场值由四个Yee网格共享,位于网格面中心的磁场值由两个Yee网格共享。Figure1YeegridoftheFDTDalgorithm图1FDTD算法的Yee网格CUDA编程模型的grid善于处理二维数据,而需要求解的电磁目标为三维结构。本文采用了最直接的切片方法(SlicingMethod)将三维空间映射到二维,并以点构成面,以面构成体的方式来实现三维结构的仿真。如图2所示,线程与三维空间中的Yee单元在位置上一一对应,x对应实际空间中的j,y对应k,并在jk平面递增。线程所计算的点在同一个平面,相邻的多个平面就组成了三维物理空间,便于完成三维电磁场仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads图2Yee网格与CUDA线程的对应关系为了提高全局存储器的访存效率,本文对切片每一层都用CudaMallocPitch函数分配冗余存储空间。Fermi计算架构64KB的片上存储器可以配置成48KB的共享内存和16KB的L1Cache,也可以配置成16KB的共享内存和48KB的L1Cache。由于共享内存需要显式的代码实现,因此,本文采用低代价的L1Cache来提高数据访问命中率。之前的尝试也证实了采用共享内存相对于采用L1Cache并没有提升算法性能。3.2FDTD算法实现流程图对于整个算法流程,计算机采用异构架构,GPU以协处理器的方式与CPU协同工作,程
维结构。本文采用了最直接的切片方法(SlicingMethod)将三维空间映射到二维,并以点构成面,以面构成体的方式来实现三维结构的仿真。如图2所示,线程与三维空间中的Yee单元在位置上一一对应,x对应实际空间中的j,y对应k,并在jk平面递增。线程所计算的点在同一个平面,相邻的多个平面就组成了三维物理空间,便于完成三维电磁场仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads图2Yee网格与CUDA线程的对应关系为了提高全局存储器的访存效率,本文对切片每一层都用CudaMallocPitch函数分配冗余存储空间。Fermi计算架构64KB的片上存储器可以配置成48KB的共享内存和16KB的L1Cache,也可以配置成16KB的共享内存和48KB的L1Cache。由于共享内存需要显式的代码实现,因此,本文采用低代价的L1Cache来提高数据访问命中率。之前的尝试也证实了采用共享内存相对于采用L1Cache并没有提升算法性能。3.2FDTD算法实现流程图对于整个算法流程,计算机采用异构架构,GPU以协处理器的方式与CPU协同工作,程序的流程图如图3所示。主机端主要负责物理目标以及集总参数电路建模、模型媒质参量初始化、内存分配、媒质网格剖分、场量和更新系数初始化,,将内存中计算所用的三维电磁场数据变量等传递到显存,激活内核进行电磁场加速仿真,并维持电磁场在时间上的推进。设备端执行核函数,更新场域,完成全局场域以及CPML区域的场值计算。由2
【相似文献】
相关期刊论文 前5条
1 许桢;;关于CPU+GPU异构计算的研究与分析[J];科技信息;2010年17期
2 金滔,徐炜民;网络并行方式的PVM异构计算环境[J];上海大学学报(自然科学版);1996年02期
3 曾国荪,周定康,黄明和;异构计算开发最大循环并行性(英文)[J];江西师范大学学报(自然科学版);2000年04期
4 鱼滨,华庆一;基于CORBA的分布式异构计算环境的分析与实践[J];西北大学学报(自然科学版);2000年02期
5 ;[J];;年期
相关会议论文 前2条
1 陈虎;陈思桐;李观钊;罗伟良;甄真;张林亚;干芸芸;赖路双;奚建清;;异构计算平台上列存储数据库的并行查询技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
2 林新华;顾一众;;上海交通大学高性能计算建设理念与实践[A];中国高等教育学会教育信息化分会第十二次学术年会论文集[C];2014年
相关重要报纸文章 前9条
1 本报记者 霍光;走出异构计算的认识误区[N];中国计算机报;2009年
2 本报记者 霍光;异构计算两大引擎再次加速[N];中国计算机报;2009年
3 ;计算:从工作到生活[N];中国计算机报;2010年
4 姑苏飘雪;异构计算,PC效率的提升之道[N];电脑报;2012年
5 本报记者 李万予;Altera披露新异构计算核心[N];中国计算机报;2013年
6 本报记者 王星;异构计算引领软件开发创新[N];电脑报;2012年
7 本报记者 霍光;计算未来[N];中国计算机报;2012年
8 ;“芯”融聚 谋未来[N];中国电脑教育报;2011年
9 李映;MIPS能否从“芯”再出发[N];中国电子报;2012年
相关博士学位论文 前1条
1 张丹;面向异构体系结构的任务流化技术研究[D];解放军信息工程大学;2012年
相关硕士学位论文 前10条
1 范兴山;基于异构计算的矩阵广义逆算法研究及实现[D];电子科技大学;2014年
2 蒲宇亮;基于异构计算系统的图像信息提取关键算法研究与实现[D];电子科技大学;2016年
3 彭玉炳;基于异构计算的CNN并行框架的设计与实现[D];电子科技大学;2016年
4 纪剑雄;基于异构计算系统中动态任务分配的蜂群算法研究[D];华东师范大学;2008年
5 周斯波;异构计算环境下的地图代数空间分析并行方法研究[D];中国地质大学;2013年
6 朱伟;异构计算环境下高性能网络模拟任务划分[D];江南大学;2014年
7 张胜辉;基于FPGA加速的异构计算多结点系统实时硬件任务调度与管理[D];华东交通大学;2013年
8 何东阳;适用异构计算环境中监控软件系统的研究与实践[D];东华大学;2012年
9 周子航;基于OpenCL异构计算的数学图像绘制[D];广州大学;2013年
10 江文;异构计算环境下任务调度算法的研究[D];湖南大学;2010年
本文编号:2558968
本文链接:https://www.wllwen.com/kejilunwen/wulilw/2558968.html