CPU-GPU异构并行计算体系的设计与实现
发布时间:2017-04-16 10:00
本文关键词:CPU-GPU异构并行计算体系的设计与实现,由笔耕文化传播整理发布。
【摘要】:随着终端设备中CPU和GPU硬件的不断升级,如何为低技术门槛用户提供高性能计算成为了当前的研究热点。在绿色高性能计算时代,CPU-GPU异构计算体系能够提供良好的通用性、性能和效能,具有广阔的发展前景。本文以现有桌面系统中的CPU和GPU硬件资源为基础,从任务划分和数据传输两方面对原有CPU-GPU异构并行技术进行了优化,降低用户对数据分配和处理的复杂度,设计并实现了CPU-GPU异构并行计算体系,提高了终端设备的处理能力。本文的研究内容及成果主要有以下几个方面:(1)在分析和研究了桌面系统中多核CPU、GPU架构,以及原有CPU-GPU异构并行技术的基础上,优化异构并行计算的解决方法,设计了异构并行计算架构,通过部署基于异构桌面系统的结点组成了并行计算体系。(2)任务分配上,计算体系按照任务的可并行性对任务进行划分,根据各异构结点的计算资源和带宽条件,从并行执行时间出发,对任务调度算法进行优化,设计负载平衡调度方案,以实现资源的最优配置。(3)计算体系在存储资源上,整体采用分布式存储的方式,桌面系统内CPU-GPU异构并行采用虚拟统一存储的方式,通过全局分布式存储与局部共享存储来平衡整体性能与编程复杂性。(4)体系采用CUDA+MPI的方式对分布式并行通信进行了优化,实现异步处理模式,以及GPU-GPU之间的数据直接传输;结点内在原有CPU-GPU异构通信方式的基础上,优化了基于总线方式的异构通信方法,通过全局数组映射数据存储的方式,减少数据传输次数,节约计算时间。本文针对体系中并行执行效率和通信传输性能,通过自建数据特征匹配库对该异构并行计算体系进行了测试。通过实验数据的对比,相比传统CPU-GPU异构并行计算结构,本文所做的优化设计明显提高了计算性能;异构并行计算体系的性能也优于传统以CPU主导的单GPU和单CPU并行计算体系。
【关键词】:并行计算 高性能计算 CPU-GPU异构 负载平衡算法
【学位授予单位】:江苏科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41;TP338.6
【目录】:
- 摘要6-7
- Abstract7-13
- 第1章 绪论13-21
- 1.1 课题研究背景和意义13-14
- 1.2 国内外研究现状及发展趋势14-19
- 1.2.1 CPU并行计算发展及研究现状15-16
- 1.2.2 GPU并行计算发展及研究现状16-17
- 1.2.3 异构并行计算的研究现状及不足17-19
- 1.3 本文的主要工作19
- 1.4 论文的组织结构19-21
- 第2章 并行计算关键技术的研究21-37
- 2.1 多核CPU并行计算的关键技术21-23
- 2.2 多核GPU并行计算的关键技术23-26
- 2.3 现有并行计算体系结构26-28
- 2.3.1 现有高性能计算体系结构26-27
- 2.3.2 分布式并行计算体系结构27-28
- 2.4 并行计算访存模型28-31
- 2.5 并行计算通信研究31-36
- 2.5.1 并行计算体系数据传输研究31-33
- 2.5.2 消息传输编程原理33-36
- 2.6 本章小结36-37
- 第3章 异构并行计算设计与实现37-45
- 3.1 CPU-GPU异构方法的优化37
- 3.2 CPU-GPU异构并行架构37-39
- 3.3 负载平衡设计39-40
- 3.3.1 CPU-GPU任务划分39
- 3.3.2 CPU-GPU通信传输设计39-40
- 3.4 CPU-GPU存储模型40
- 3.5 整体流程40-41
- 3.6 数据测试与分析41-44
- 3.6.1 实验测试环境41-42
- 3.6.2 实验测试结果42-43
- 3.6.3 结果分析43-44
- 3.7 本章小结44-45
- 第4章 体系的整体设计与实现45-63
- 4.1 设计思路45-47
- 4.1.1 体系设计目标45-46
- 4.1.2 设计细节分析46-47
- 4.2 体系架构设计与分析47-49
- 4.3 异构并行计算体系网络架构49-50
- 4.3.1 以太网下计算结点I/O架构49
- 4.3.2 Infiniband计算结点I/O架构49-50
- 4.4 负载平衡50-56
- 4.4.1 任务分析和划分52-53
- 4.4.2 数据传输控制53-56
- 4.5 详细设计56-61
- 4.5.1 整体设计56-58
- 4.5.2 负载平衡算法设计58-61
- 4.6 整体流程61
- 4.7 本章小结61-63
- 第5章 体系平台测试和总结63-67
- 5.1 测试环境准备63-64
- 5.2 体系性能测试64-65
- 5.3 测试数据分析65-66
- 5.4 本章小结66-67
- 总结与展望67-69
- 参考文献69-72
- 攻读硕士学位期间发表的论文72-74
- 致谢74
【参考文献】
中国期刊全文数据库 前2条
1 陈华平 ;黄刘生 ;安虹 ;陈国良;;并行分布计算中的任务调度及其分类[J];计算机科学;2001年01期
2 柴亚辉;沈文枫;张倬;唐振;;Cell BE高性能计算实验平台设计与实现[J];实验室研究与探索;2011年05期
本文关键词:CPU-GPU异构并行计算体系的设计与实现,由笔耕文化传播整理发布。
,本文编号:310539
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/310539.html