当前位置:主页 > 科技论文 > 计算机论文 >

基于异构计算的电磁仿真并行算法研究

发布时间:2017-07-16 06:12

  本文关键词:基于异构计算的电磁仿真并行算法研究


  更多相关文章: 计算电磁学 时域有限差分法 异构计算 图形处理器 计算统一设备架构


【摘要】:时域有限差分(Finite Difference Time Domain, FDTD)法是求解电磁学麦克斯韦方程组的重要方法之一,一直以来获得了广泛的使用。时域有限差分法直接将含时间变量的麦克斯韦微分方程在Yee氏网格空间中采用中心差分方法转换为差分方程。为了保证解的稳定性,抑制数值色散,FDTD的空间步长和时间步长不宜过大。尤其在求解电大尺寸问题时,FDTD方法是非常耗时和耗内存的。FDTD算法具有天然可并行性,采用并行计算的方法可以缩短计算时间,提高计算速度。近年来,随着硬件技术的快速发展,图形处理器(Graphic Processing Unit, GPU)的实际浮点运算性能远远超过同期的CPU,并且价格低廉。随着计算统一设备架构(Compute Unified Device Architecture, CUD A)模型的出现,使用图形处理器进行并行程序的开发变得非常简洁高效。本文以“天河一号”(TH-1A)超级计算机为平台,采用CUDA开发工具,完成了三维FDTD高性能加速计算。论文主要完成工作如下:(1)在平台上,首次将TH-1A超级计算机系统的应用拓展到电磁计算领域。本次研究采用湖南大学超级计算机中心的超算系统为平台,利用其高LINPACK性能峰值和异构协同并行的特性,实现了三维FDTD并行算法。(2)在算法优化上,采用页锁定内存来存储需要在主机端使用的场量,减少数据传输消耗;将场量采用低代价的L1 cache缓存,提高数据访问命中率。优化后的三维F DTD并行算法,相比未进行优化的异构并行算法加速比提升了4倍左右。(3)在算法评价体系上,从不同方面对设计的三维FDTD并行算法进行了比较分析,进一步从多个方面说明了算法的高速率特性。(4)在电磁应用上,扩充了三维FDTD并行算法在电磁计算方面的实际应用。5对带阻滤波器进行仿真计算,实验结果表明,与串行算法相比,加速比达到55倍,计算误差在10-4范围内。
【关键词】:计算电磁学 时域有限差分法 异构计算 图形处理器 计算统一设备架构
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O441;TP338.6
【目录】:
  • 摘要5-6
  • Abstract6-11
  • 第1章 引言11-22
  • 1.1 电磁计算方法及其应用11-16
  • 1.1.1 有限元法12-13
  • 1.1.2 矩量法13-14
  • 1.1.3 时域有限差分法14-16
  • 1.2 论文的研究背景及意义16-17
  • 1.3 研究状况与进展17-19
  • 1.4 主要工作与创新19-20
  • 1.5 论文的组织框架20-22
  • 第2章 并行计算及通用图形处理器技术22-42
  • 2.1 并行计算技术22-27
  • 2.1.1 并行计算硬件环境22-24
  • 2.1.2 并行计算软件编程模型24-27
  • 2.2 并行计算的性能评估27-29
  • 2.2.1 并行程序执行时间27-28
  • 2.2.2 并行加速比和并行效率28
  • 2.2.3 算法的可扩展性28-29
  • 2.3 通用图形处理技术29-31
  • 2.3.1 图形处理器29-30
  • 2.3.2 并行程序开发30-31
  • 2.4 CUDA的硬件架构31-34
  • 2.4.1 Fermi架构31-33
  • 2.4.2 kepler架构33-34
  • 2.5 CUDA编程模型34-41
  • 2.5.1 主机与设备34-35
  • 2.5.2 线程层次35-37
  • 2.5.3 硬件映射37-38
  • 2.5.4 软件体系38-39
  • 2.5.5 存储体系39-41
  • 2.6 小结41-42
  • 第3章 时域有限差分算法42-60
  • 3.1 Maxwell方程组及其FDTD形式42-47
  • 3.1.1 Maxwell方程组和Yee元胞42-43
  • 3.1.2 三维空间的FDTD43-45
  • 3.1.3 介质表面电磁参数45-47
  • 3.2 数值稳定性和色散47-48
  • 3.3 激励源48-49
  • 3.3.1 时谐场源48
  • 3.3.2 脉冲源48-49
  • 3.4 吸收边界条件49-55
  • 3.4.1 Mur吸收边界49-50
  • 3.4.2 完全匹配层吸收边界50-54
  • 3.4.3 卷积完全匹配层54-55
  • 3.5 实际应用中的三维FDTD并行算法55-59
  • 3.5.1 实际应用中介质表面电磁参数的选取55-56
  • 3.5.2 实际应用中CPML参数分布56-58
  • 3.5.3 经典理论与应用分析58-59
  • 3.7 小结59-60
  • 第4章 基于CUDA的三维CPML-FDTD并行算法仿真及应用60-79
  • 4.1 三维CPML-FDTD并行算法60-63
  • 4.1.1 并行算法设计60-61
  • 4.1.2 并行算法优化61-63
  • 4.2 三维CPML-FDTD并行算法实现63-66
  • 4.3 三维CPML-FDTD并行算法的应用66-72
  • 4.3.1 电路算例67-68
  • 4.3.2 带阻滤波器算例68-72
  • 4.4 程序功能和性能验证72-78
  • 4.4.1 实验环境72-73
  • 4.4.2 评价指标73
  • 4.4.3 实验结果分析73-78
  • 4.5 小结78-79
  • 总结与展望79-81
  • 参考文献81-86
  • 致谢86-87
  • 附录A 攻读硕士学位期间所发表的主要学术论文目录87-88
  • 附录B 攻读硕士学位期间所参加的科研项目目录88


本文编号:547335

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/547335.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bbdbe***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com