面向GPU/CPU异构系统的数据流任务划分与调度
发布时间:2023-06-01 04:00
异构计算机结合了GPU的强大并行能力和CPU的逻辑处理能力,在商业和科研领域被广泛使用。但要充分发挥异构计算机的性能,需要对硬件资源进行合理的调配。COStream作为一种数据流编程语言具有通信和计算分离的特点,在传统多核CPU上有良好的并行效果,但面对异构系统的复杂环境,其也面临着设备间负载不均衡、通信开销过大等问题。为了充分发挥异构系统的优势,以COStream数据流编程语言为研究对象,设计了面向GPU/CPU异构系统的数据流任务划分算法和优化方案,包括异构负载均衡划分算法、设备间通信节点优化和NDrange(N-Dimension range)优化。异构负载均衡划分算法分为设备间数据流任务初步划分、负载预估与负载调整、设备内任务划分三个步骤,结合数据流图的并行特性对数据流任务进行层层划分。该算法具有两大优势:充分挖掘数据流程序的并行特性,将计算节点按照其特性划分到最适合的计算设备,发挥各计算设备优势;预估并调整了设备间的负载情况,在考虑通信开销的同时使各设备之间负载尽量均衡,提高软件流水线性能。针对异构设备间通信开销大这一问题,设备间通信节点优化将通信任务从GPU计算节点独立,以...
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究目的及意义
1.2 国内外研究现状
1.3 研究目标和所做的工作
1.4 论文的组织结构
2 面向异构系统的数据流任务划分
2.1 问题引入
2.2 设备间数据流任务初步划分
2.3 负载预估与负载调整
2.4 设备内任务划分
2.5 本章小结
3 后端优化与代码生成
3.1 GPU/CPU间通信节点优化
3.2 NDrange优化
3.3 数据流程序调度与代码生成
3.4 面向异构系统的COStream文法扩展
3.5 本章小结
4 实验测试与结果分析
4.1 实验平台和测试程序
4.2 异构负载均衡划分算法实验
4.3 异构后端优化实验
4.4 本章小结
5 总结与展望
5.1 全文总结
5.2 存在的问题
5.3 研究展望
致谢
参考文献
本文编号:3826611
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究目的及意义
1.2 国内外研究现状
1.3 研究目标和所做的工作
1.4 论文的组织结构
2 面向异构系统的数据流任务划分
2.1 问题引入
2.2 设备间数据流任务初步划分
2.3 负载预估与负载调整
2.4 设备内任务划分
2.5 本章小结
3 后端优化与代码生成
3.1 GPU/CPU间通信节点优化
3.2 NDrange优化
3.3 数据流程序调度与代码生成
3.4 面向异构系统的COStream文法扩展
3.5 本章小结
4 实验测试与结果分析
4.1 实验平台和测试程序
4.2 异构负载均衡划分算法实验
4.3 异构后端优化实验
4.4 本章小结
5 总结与展望
5.1 全文总结
5.2 存在的问题
5.3 研究展望
致谢
参考文献
本文编号:3826611
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3826611.html