基于异构计算的电磁仿真并行算法研究

发布时间：2017-07-16 06:12

本文关键词：基于异构计算的电磁仿真并行算法研究

【摘要】：时域有限差分(Finite Difference Time Domain, FDTD)法是求解电磁学麦克斯韦方程组的重要方法之一,一直以来获得了广泛的使用。时域有限差分法直接将含时间变量的麦克斯韦微分方程在Yee氏网格空间中采用中心差分方法转换为差分方程。为了保证解的稳定性,抑制数值色散,FDTD的空间步长和时间步长不宜过大。尤其在求解电大尺寸问题时,FDTD方法是非常耗时和耗内存的。FDTD算法具有天然可并行性,采用并行计算的方法可以缩短计算时间,提高计算速度。近年来,随着硬件技术的快速发展,图形处理器(Graphic Processing Unit, GPU)的实际浮点运算性能远远超过同期的CPU,并且价格低廉。随着计算统一设备架构(Compute Unified Device Architecture, CUD A)模型的出现,使用图形处理器进行并行程序的开发变得非常简洁高效。本文以“天河一号”(TH-1A)超级计算机为平台,采用CUDA开发工具,完成了三维FDTD高性能加速计算。论文主要完成工作如下：(1)在平台上,首次将TH-1A超级计算机系统的应用拓展到电磁计算领域。本次研究采用湖南大学超级计算机中心的超算系统为平台,利用其高LINPACK性能峰值和异构协同并行的特性,实现了三维FDTD并行算法。(2)在算法优化上,采用页锁定内存来存储需要在主机端使用的场量,减少数据传输消耗；将场量采用低代价的L1 cache缓存,提高数据访问命中率。优化后的三维F DTD并行算法,相比未进行优化的异构并行算法加速比提升了4倍左右。(3)在算法评价体系上,从不同方面对设计的三维FDTD并行算法进行了比较分析,进一步从多个方面说明了算法的高速率特性。(4)在电磁应用上,扩充了三维FDTD并行算法在电磁计算方面的实际应用。5对带阻滤波器进行仿真计算,实验结果表明,与串行算法相比,加速比达到55倍,计算误差在10-4范围内。
【关键词】：计算电磁学 时域有限差分法 异构计算 图形处理器 计算统一设备架构
【学位授予单位】：湖南大学
【学位级别】：硕士
【学位授予年份】：2016
【分类号】：O441;TP338.6
【目录】：

摘要5-6
Abstract6-11
第1章引言11-22
1.1 电磁计算方法及其应用11-16
1.1.1 有限元法12-13
1.1.2 矩量法13-14
1.1.3 时域有限差分法14-16
1.2 论文的研究背景及意义16-17
1.3 研究状况与进展17-19
1.4 主要工作与创新19-20
1.5 论文的组织框架20-22
第2章并行计算及通用图形处理器技术22-42
2.1 并行计算技术22-27
2.1.1 并行计算硬件环境22-24
2.1.2 并行计算软件编程模型24-27
2.2 并行计算的性能评估27-29
2.2.1 并行程序执行时间27-28
2.2.2 并行加速比和并行效率28
2.2.3 算法的可扩展性28-29
2.3 通用图形处理技术29-31
2.3.1 图形处理器29-30
2.3.2 并行程序开发30-31
2.4 CUDA的硬件架构31-34
2.4.1 Fermi架构31-33
2.4.2 kepler架构33-34
2.5 CUDA编程模型34-41
2.5.1 主机与设备34-35
2.5.2 线程层次35-37
2.5.3 硬件映射37-38
2.5.4 软件体系38-39
2.5.5 存储体系39-41
2.6 小结41-42
第3章时域有限差分算法42-60
3.1 Maxwell方程组及其FDTD形式42-47
3.1.1 Maxwell方程组和Yee元胞42-43
3.1.2 三维空间的FDTD43-45
3.1.3 介质表面电磁参数45-47
3.2 数值稳定性和色散47-48
3.3 激励源48-49
3.3.1 时谐场源48
3.3.2 脉冲源48-49
3.4 吸收边界条件49-55
3.4.1 Mur吸收边界49-50
3.4.2 完全匹配层吸收边界50-54
3.4.3 卷积完全匹配层54-55
3.5 实际应用中的三维FDTD并行算法55-59
3.5.1 实际应用中介质表面电磁参数的选取55-56
3.5.2 实际应用中CPML参数分布56-58
3.5.3 经典理论与应用分析58-59
3.7 小结59-60
第4章基于CUDA的三维CPML-FDTD并行算法仿真及应用60-79
4.1 三维CPML-FDTD并行算法60-63
4.1.1 并行算法设计60-61
4.1.2 并行算法优化61-63
4.2 三维CPML-FDTD并行算法实现63-66
4.3 三维CPML-FDTD并行算法的应用66-72
4.3.1 电路算例67-68
4.3.2 带阻滤波器算例68-72
4.4 程序功能和性能验证72-78
4.4.1 实验环境72-73
4.4.2 评价指标73
4.4.3 实验结果分析73-78
4.5 小结78-79
总结与展望79-81
参考文献81-86
致谢86-87
附录A 攻读硕士学位期间所发表的主要学术论文目录87-88
附录B 攻读硕士学位期间所参加的科研项目目录88

，

本文编号：547335

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/547335.html

上一篇：嵌入式SRAM编译器时序功耗模型的建立与验证
下一篇：基于云计算的高速公路海量数据存取方法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|