基于异构计算的电磁仿真并行算法研究
发布时间:2017-07-16 06:12
本文关键词:基于异构计算的电磁仿真并行算法研究
更多相关文章: 计算电磁学 时域有限差分法 异构计算 图形处理器 计算统一设备架构
【摘要】:时域有限差分(Finite Difference Time Domain, FDTD)法是求解电磁学麦克斯韦方程组的重要方法之一,一直以来获得了广泛的使用。时域有限差分法直接将含时间变量的麦克斯韦微分方程在Yee氏网格空间中采用中心差分方法转换为差分方程。为了保证解的稳定性,抑制数值色散,FDTD的空间步长和时间步长不宜过大。尤其在求解电大尺寸问题时,FDTD方法是非常耗时和耗内存的。FDTD算法具有天然可并行性,采用并行计算的方法可以缩短计算时间,提高计算速度。近年来,随着硬件技术的快速发展,图形处理器(Graphic Processing Unit, GPU)的实际浮点运算性能远远超过同期的CPU,并且价格低廉。随着计算统一设备架构(Compute Unified Device Architecture, CUD A)模型的出现,使用图形处理器进行并行程序的开发变得非常简洁高效。本文以“天河一号”(TH-1A)超级计算机为平台,采用CUDA开发工具,完成了三维FDTD高性能加速计算。论文主要完成工作如下:(1)在平台上,首次将TH-1A超级计算机系统的应用拓展到电磁计算领域。本次研究采用湖南大学超级计算机中心的超算系统为平台,利用其高LINPACK性能峰值和异构协同并行的特性,实现了三维FDTD并行算法。(2)在算法优化上,采用页锁定内存来存储需要在主机端使用的场量,减少数据传输消耗;将场量采用低代价的L1 cache缓存,提高数据访问命中率。优化后的三维F DTD并行算法,相比未进行优化的异构并行算法加速比提升了4倍左右。(3)在算法评价体系上,从不同方面对设计的三维FDTD并行算法进行了比较分析,进一步从多个方面说明了算法的高速率特性。(4)在电磁应用上,扩充了三维FDTD并行算法在电磁计算方面的实际应用。5对带阻滤波器进行仿真计算,实验结果表明,与串行算法相比,加速比达到55倍,计算误差在10-4范围内。
【关键词】:计算电磁学 时域有限差分法 异构计算 图形处理器 计算统一设备架构
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O441;TP338.6
【目录】:
- 摘要5-6
- Abstract6-11
- 第1章 引言11-22
- 1.1 电磁计算方法及其应用11-16
- 1.1.1 有限元法12-13
- 1.1.2 矩量法13-14
- 1.1.3 时域有限差分法14-16
- 1.2 论文的研究背景及意义16-17
- 1.3 研究状况与进展17-19
- 1.4 主要工作与创新19-20
- 1.5 论文的组织框架20-22
- 第2章 并行计算及通用图形处理器技术22-42
- 2.1 并行计算技术22-27
- 2.1.1 并行计算硬件环境22-24
- 2.1.2 并行计算软件编程模型24-27
- 2.2 并行计算的性能评估27-29
- 2.2.1 并行程序执行时间27-28
- 2.2.2 并行加速比和并行效率28
- 2.2.3 算法的可扩展性28-29
- 2.3 通用图形处理技术29-31
- 2.3.1 图形处理器29-30
- 2.3.2 并行程序开发30-31
- 2.4 CUDA的硬件架构31-34
- 2.4.1 Fermi架构31-33
- 2.4.2 kepler架构33-34
- 2.5 CUDA编程模型34-41
- 2.5.1 主机与设备34-35
- 2.5.2 线程层次35-37
- 2.5.3 硬件映射37-38
- 2.5.4 软件体系38-39
- 2.5.5 存储体系39-41
- 2.6 小结41-42
- 第3章 时域有限差分算法42-60
- 3.1 Maxwell方程组及其FDTD形式42-47
- 3.1.1 Maxwell方程组和Yee元胞42-43
- 3.1.2 三维空间的FDTD43-45
- 3.1.3 介质表面电磁参数45-47
- 3.2 数值稳定性和色散47-48
- 3.3 激励源48-49
- 3.3.1 时谐场源48
- 3.3.2 脉冲源48-49
- 3.4 吸收边界条件49-55
- 3.4.1 Mur吸收边界49-50
- 3.4.2 完全匹配层吸收边界50-54
- 3.4.3 卷积完全匹配层54-55
- 3.5 实际应用中的三维FDTD并行算法55-59
- 3.5.1 实际应用中介质表面电磁参数的选取55-56
- 3.5.2 实际应用中CPML参数分布56-58
- 3.5.3 经典理论与应用分析58-59
- 3.7 小结59-60
- 第4章 基于CUDA的三维CPML-FDTD并行算法仿真及应用60-79
- 4.1 三维CPML-FDTD并行算法60-63
- 4.1.1 并行算法设计60-61
- 4.1.2 并行算法优化61-63
- 4.2 三维CPML-FDTD并行算法实现63-66
- 4.3 三维CPML-FDTD并行算法的应用66-72
- 4.3.1 电路算例67-68
- 4.3.2 带阻滤波器算例68-72
- 4.4 程序功能和性能验证72-78
- 4.4.1 实验环境72-73
- 4.4.2 评价指标73
- 4.4.3 实验结果分析73-78
- 4.5 小结78-79
- 总结与展望79-81
- 参考文献81-86
- 致谢86-87
- 附录A 攻读硕士学位期间所发表的主要学术论文目录87-88
- 附录B 攻读硕士学位期间所参加的科研项目目录88
本文编号:547335
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/547335.html