基于3D-EW算法的Intel KNC架构下的性能分析与调优
发布时间:2017-08-22 04:08
本文关键词:基于3D-EW算法的Intel KNC架构下的性能分析与调优
【摘要】:在地球物理的研究过程中,由于弹性波波场携带着与地下介质性质相关的大量信息,所以一直以来是个重要的研究领域。在实际的工业生产过程中,利用计算机对于弹性波波场进行数值模拟更是地震预测和石油勘探等领域中的一项重要技术。在其数值模拟过程中,针对混合波场的三维纵横波波场分离问题的数值模拟算法3D-EW(3D pure P and S wave elastic wave equation modelling)需要大量的迭代计算过程,属于计算密集型问题。本文从异构并行计算的角度出发,首先将3D-EW算法通过线程级并行编程模型OpenMP成功地移植到Intel众核(Many Integrated Core)架构协处理器平台上,相较运行在Intel Xeon处理器平台上的串行版本实现了3.7倍的加速比。通过针对众核协处理器平台的Knights Corner微架构的研究,总结该架构的潜在性能瓶颈以及架构设计特性。在实验过程中,结合性能分析工具的性能指标测试和分析,基于传统的处理器调优技巧,进一步地归纳了基于Knights Corner架构的数据级和指令级并行的性能优化技巧。发现了KNC架构下的计算性能与向量化程度以及缓存性能的紧密关系,进而采用C intrinsic的底层接口改写代码增强程序的向量化程度,使用cache blocking技术提高数据局部性。最终将3D-EW算法在Intel5110P协处理器上的加速比提高至17.7倍,从而显著提升了程序运行效率。同时也为更多应用在Knights Corner架构下的性能调优提供了参考。
【关键词】:XeonPhi 高性能计算 性能优化
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:P631.4
【目录】:
- 摘要3-4
- ABSTRACT4-10
- 第一章 研究背景10-20
- 1.1 弹性波波场问题10-12
- 1.1.1 三维弹性波10
- 1.1.2 波场分离10
- 1.1.3 3D-EW算法10-12
- 1.2 高性能计算12-14
- 1.3 Xeon Phi协处理器14-16
- 1.3.1 架构概要14-15
- 1.3.2 编程模型15-16
- 1.4 性能分析16-17
- 1.5 相关研究工作17-18
- 1.6 研究目的18-20
- 第二章 Knight Corner微架构的分析与研究20-28
- 2.1 架构综述20-22
- 2.1.1 核芯技术20-21
- 2.1.2 向量处理单元21-22
- 2.1.3 众核互联技术22
- 2.2 存储架构22-26
- 2.2.1 缓存机制23-25
- 2.2.2 内存带宽25-26
- 2.3 线程模型26-28
- 第三章 基于KNC架构的 3D-EW算法性能分析28-34
- 3.1 性能分析工具28-30
- 3.2 线程级并行30
- 3.3 数据级并行30-31
- 3.4 指令级并行31-32
- 3.5 缓存使用情况32-34
- 第四章 基于KNC架构的 3D-EW算法性能优化34-48
- 4.1 线程级优化34-37
- 4.1.1 热点分析34-36
- 4.1.2 Open MP并行化36-37
- 4.2 数据级优化37-43
- 4.2.1 数据对齐37-38
- 4.2.2 SIMD38-40
- 4.2.3 数据局部性40
- 4.2.4 数据预取40-43
- 4.3 指令级优化43-46
- 4.3.1 C intrinsic编程43-44
- 4.3.2 FMA44-45
- 4.3.3 gather/scatter45-46
- 4.4 缓存使用优化46-48
- 第五章 实验结果与分析48-54
- 5.1 实验环境48-49
- 5.1.1 硬件环境48
- 5.1.2 软件环境48-49
- 5.2 实验结果49-50
- 5.3 实验分析50-54
- 第六章 总结与展望54-56
- 6.1 总结54-55
- 6.2 未来工作的展望55-56
- 参考文献56-60
- 攻读学位期间发表的学术论文目录60-62
【参考文献】
中国期刊全文数据库 前2条
1 陈祖银;王用军;彭达;;弹性波波场分离数值模拟[J];中国石油勘探;2014年06期
2 马德堂,朱光明;弹性波波场P波和S波分解的数值模拟[J];石油地球物理勘探;2003年05期
,本文编号:716944
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/716944.html