高性能计算云环境下GPU并行计算技术及应用研究
发布时间:2024-03-31 14:34
近年来,GPU(Graphics Processing Unit)并行计算技术已成为高性能计算(High Performance Computing,HPC)领域的研究热点。GPU硬件具有强大的浮点计算能力,为大型科学计算和工程计算问题提供了良好的支撑。目前,除了传统高性能计算应用以外,新兴高性能计算应用的需求也在增长。在用户服务方面,高性能计算面临着诸多问题:如何向用户提供灵活的服务模式,使用户能够自主管理计算资源;如何向用户提供可动态伸缩的计算资源,提升高性能计算设备的利用率。作为一种基于云计算的高性能计算资源管理和服务模式,高性能计算云能够解决传统高性能计算中所面临的用户服务方面的问题。高性能计算云和GPU并行计算是当前计算机应用技术的两个热点研究领域。这两个研究热点的结合部分是关于高性能计算云环境下GPU并行计算技术研究以及相关应用,但该部分的研究还处于起步阶段。云环境下GPU计算资源的调度管理,以及GPU计算通信的性能损失对高性能计算云中GPU并行计算技术的研究提出了极大的挑战。因此需要针对该类高性能计算云,开展GPU计算技术研究,从而为未来搭建基于GPU的大型高性能计算云平...
【文章页数】:137 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.1.1 GPU高性能计算概述
1.1.2 云计算概述
1.1.3 高性能计算云概述
1.1.4 高性能计算云环境下GPU计算面临挑战
1.2 研究动机
1.3 研究内容和创新点
1.3.1 研究内容
1.3.2 论文创新点
1.4 论文结构
第二章 国内外相关研究工作及分析
2.1 高性能计算云及其应用
2.1.1 高性能计算与云计算之间的差异
2.1.2 高性能计算云研究现状
2.1.3 高性能计算云的应用
2.2 基于GPU的高性能计算云及关键技术
2.2.1 高性能计算云中的虚拟化技术
2.2.2 GPU虚拟化技术
2.2.3 云计算中资源调度策略
2.2.4 GPU计算资源调度策略
2.3 本章总结
第三章 高性能计算云环境下多GPU计算资源调度机制
3.1 引言
3.2 建模和问题描述
3.2.1 GPU计算资源模型
3.2.2 多GPU计算任务模型
3.2.3 问题分析
3.3 系统架构
3.4 调度机制描述
3.4.1 多GPU负载模型
3.4.2 基于树型结构的GPU资源分布式检索算法
3.5 实验结果及性能分析
3.5.1 实验环境和设置
3.5.2 资源利用率分析
3.5.3 服务请求分析
3.5.4 服务质量分析
3.6 本章小结
第四章 高性能计算云环境下GPU通信机制研究
4.1 引言
4.2 高性能计算云环境下多GPU通信相关技术
4.2.1 GPU内线程通信
4.2.2 多GPU通信接口
4.2.3 云环境下虚拟机的计算通信
4.3 一种高性能计算云环境下GPU计算低延迟通信
4.3.1 云平台中GPU计算通信分析
4.3.2 改进的GPU计算低延迟通信策略
4.3.3 实时数据高复用策略
4.4 实验结果及性能分析
4.4.1 实验设置
4.4.2 有效性分析
4.4.3 可扩展性分析
4.4.4 数据松耦合交互应用测试
4.4.5 数据紧耦合交互应用测试
4.5 本章小结
第五章 基于GPU的量子搜索算法仿真研究
5.1 引言
5.2 量子计算的叠加性及量子搜索算法特点
5.3 一种压缩存储的量子搜索算法仿真
5.3.1 相关数据结构
5.3.2 算法仿真工作流
5.3.3 存储压缩优化
5.3.4 存储访问优化
5.3.5 实验数据与分析
5.4 通用量子搜索算法仿真
5.4.1 量子叠加性仿真
5.4.2 中间变量仿真
5.4.3 存储访问优化
5.4.4 实验结果
5.5 本章小结
第六章 基于GPU的三维断层成像重构研究
6.1 引言
6.2 基于输入-输出混合(HIO)算法的三维断层成像重构
6.2.1 混合型的输入-输出混合(HIO)算法
6.2.2 三维空间下的采样方案
6.2.3 非对称空间下的二维傅里叶变换
6.2.4 一种圆柱型的三维傅里叶变换
6.3 非对称傅里叶变换(NFT)的并行化策略
6.3.1 输入驱动方法下的数据集压缩
6.3.2 存储访问优化
6.3.3 聚集状采样点下的负载平衡策略
6.4 基于GPU的三维重构算法并行化方法
6.4.1 三维CFT计算
6.4.2 GPU中的计算流程
6.5 数值实验及分析
6.5.1 单精度下的NFT性能分析
6.5.2 双精度下的NFT中卷积步骤的性能分析
6.5.3 三维输入-输出混合(HIO)算法的性能分析
6.5.4 可用性测试
6.6 本章小结
第七章 结论与展望
7.1 论文研究工作总结
7.2 进一步工作展望
参考文献
致谢
在学期间的研究成果及发表的学术论文
本文编号:3944072
【文章页数】:137 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.1.1 GPU高性能计算概述
1.1.2 云计算概述
1.1.3 高性能计算云概述
1.1.4 高性能计算云环境下GPU计算面临挑战
1.2 研究动机
1.3 研究内容和创新点
1.3.1 研究内容
1.3.2 论文创新点
1.4 论文结构
第二章 国内外相关研究工作及分析
2.1 高性能计算云及其应用
2.1.1 高性能计算与云计算之间的差异
2.1.2 高性能计算云研究现状
2.1.3 高性能计算云的应用
2.2 基于GPU的高性能计算云及关键技术
2.2.1 高性能计算云中的虚拟化技术
2.2.2 GPU虚拟化技术
2.2.3 云计算中资源调度策略
2.2.4 GPU计算资源调度策略
2.3 本章总结
第三章 高性能计算云环境下多GPU计算资源调度机制
3.1 引言
3.2 建模和问题描述
3.2.1 GPU计算资源模型
3.2.2 多GPU计算任务模型
3.2.3 问题分析
3.3 系统架构
3.4 调度机制描述
3.4.1 多GPU负载模型
3.4.2 基于树型结构的GPU资源分布式检索算法
3.5 实验结果及性能分析
3.5.1 实验环境和设置
3.5.2 资源利用率分析
3.5.3 服务请求分析
3.5.4 服务质量分析
3.6 本章小结
第四章 高性能计算云环境下GPU通信机制研究
4.1 引言
4.2 高性能计算云环境下多GPU通信相关技术
4.2.1 GPU内线程通信
4.2.2 多GPU通信接口
4.2.3 云环境下虚拟机的计算通信
4.3 一种高性能计算云环境下GPU计算低延迟通信
4.3.1 云平台中GPU计算通信分析
4.3.2 改进的GPU计算低延迟通信策略
4.3.3 实时数据高复用策略
4.4 实验结果及性能分析
4.4.1 实验设置
4.4.2 有效性分析
4.4.3 可扩展性分析
4.4.4 数据松耦合交互应用测试
4.4.5 数据紧耦合交互应用测试
4.5 本章小结
第五章 基于GPU的量子搜索算法仿真研究
5.1 引言
5.2 量子计算的叠加性及量子搜索算法特点
5.3 一种压缩存储的量子搜索算法仿真
5.3.1 相关数据结构
5.3.2 算法仿真工作流
5.3.3 存储压缩优化
5.3.4 存储访问优化
5.3.5 实验数据与分析
5.4 通用量子搜索算法仿真
5.4.1 量子叠加性仿真
5.4.2 中间变量仿真
5.4.3 存储访问优化
5.4.4 实验结果
5.5 本章小结
第六章 基于GPU的三维断层成像重构研究
6.1 引言
6.2 基于输入-输出混合(HIO)算法的三维断层成像重构
6.2.1 混合型的输入-输出混合(HIO)算法
6.2.2 三维空间下的采样方案
6.2.3 非对称空间下的二维傅里叶变换
6.2.4 一种圆柱型的三维傅里叶变换
6.3 非对称傅里叶变换(NFT)的并行化策略
6.3.1 输入驱动方法下的数据集压缩
6.3.2 存储访问优化
6.3.3 聚集状采样点下的负载平衡策略
6.4 基于GPU的三维重构算法并行化方法
6.4.1 三维CFT计算
6.4.2 GPU中的计算流程
6.5 数值实验及分析
6.5.1 单精度下的NFT性能分析
6.5.2 双精度下的NFT中卷积步骤的性能分析
6.5.3 三维输入-输出混合(HIO)算法的性能分析
6.5.4 可用性测试
6.6 本章小结
第七章 结论与展望
7.1 论文研究工作总结
7.2 进一步工作展望
参考文献
致谢
在学期间的研究成果及发表的学术论文
本文编号:3944072
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3944072.html