当前位置:主页 > 科技论文 > 计算机论文 >

基于OpenCL的多GPU并行计算的研究与应用

发布时间:2017-09-29 09:04

  本文关键词:基于OpenCL的多GPU并行计算的研究与应用


  更多相关文章: 异构计算 开放运算语言 GPU通用计算 并行计算


【摘要】:异构计算被视为计算机处理器的发展继单核、多核之后的第三个时代,它实现了多种体系架构的处理器间协同运算,有效缓解在提升CPU时钟频率和内核数量的过程中遇到的散热和能耗问题,同时增强了计算平台的可扩展性。 异构计算系统通常包含除CPU以外的一个或多个协处理器,协处理器一般是包含众多处理核心的专用功能计算设备,只有通过合适的并行程序才能充分利用其并行计算能力。OpenCL是一个为异构设备编写程序的标准框架,,虽然它的出现增加了程序在各平台之间的可移植性,但是在多个计算设备协同计算时,多种计算设备的调用、设备间的负载均衡等问题严重制约了它的普及。因此,对异构系统下多设备并行计算的研究具有重要的意义。 本文依据OpenCL规范,利用多线程技术实现了多平台下多GPU的调用,分析了不同的任务划分模型对计算性能的影响,优化了存储器间的数据传输。随后,设计了可利用多个GPU辅助加速的两个算法来验证多GPU并行计算研究的可行性,第一个算法为适合较大规模数据的内部排序算法,算法中设计了适合设备端的GPU内部排序算法和主机端的基于败者树数据结构的归并排序算法,与CPU串行排序算法相比,该算法在多GPU的辅助下对较大规模数据的排序运算时,性能提升了十倍左右。另一个算法利用多GPU加速柔性作业车间调度问题的求解,该算法设计了适合GPU架构的数据结构以及基于岛屿模型的遗传算法,利用GPU提高了种群内个体的进化以及个体的评估效率。该算法在多GPU的加速下,与基于CPU的遗传算法求解柔性作业车间调度问题相比,在处理更大种群规模的前提下,在更短的时间内取得了较优的解。
【关键词】:异构计算 开放运算语言 GPU通用计算 并行计算
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP338.6
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 第1章 绪论10-18
  • 1.1 课题研究的背景和意义10-11
  • 1.2 异构计算的介绍及研究现状11-16
  • 1.2.1 CPU-GPU 异构计算11-13
  • 1.2.2 CPU-GPU 协同计算模式13-14
  • 1.2.3 国内外研究现状与应用14-16
  • 1.3 课题的来源及研究内容16-18
  • 1.3.1 课题来源16-17
  • 1.3.2 课题的主要研究内容17-18
  • 第2章 OpenCL 概述18-28
  • 2.1 异构计算18-19
  • 2.2 并行编程模型19-22
  • 2.2.1 OpenMP 编程模型20-22
  • 2.2.2 流编程模型22
  • 2.3 OpenCL 简介22-27
  • 2.3.1 OpenCL 与 CUDA 架构的关系23
  • 2.3.2 OpenCL 模型介绍23-27
  • 2.4 OpenCL 编程步骤27
  • 2.5 本章小结27-28
  • 第3章 多 GPU 的调用以及性能优化研究28-38
  • 3.1 多 GPU 的调用28-33
  • 3.1.1 单平台下多 GPU 的调用28-30
  • 3.1.2 多平台下多 GPU 的调用30-33
  • 3.2 负载均衡分析与设计33-35
  • 3.3 存储器间数据传输分析与优化35-37
  • 3.3.1 数据传输分析35-36
  • 3.3.2 全局存储器访存优化36-37
  • 3.4 本章小结37-38
  • 第4章 基于多 GPU 辅助的内部排序算法38-44
  • 4.1 算法分析与设计38-41
  • 4.1.1 基于 GPU 的排序算法39-40
  • 4.1.2 基于 CPU 的归并排序算法40-41
  • 4.2 算法性能分析41-43
  • 4.2.1 空间复杂度41-42
  • 4.2.2 时间复杂度42
  • 4.2.3 实验结果与分析42-43
  • 4.3 本章小结43-44
  • 第5章 基于多 GPU 的柔性作业车间调度问题研究44-56
  • 5.1 柔性作业车间调度问题描述及研究现状44-46
  • 5.1.1 FJSP 问题描述44-45
  • 5.1.2 FJSP 评价指标45
  • 5.1.3 基于遗传算法的 FJSP 问题研究现状45-46
  • 5.2 算法设计46-54
  • 5.2.1 存储模型46-47
  • 5.2.2 执行模型47-49
  • 5.2.3 染色体模型49-51
  • 5.2.4 遗传算法51-54
  • 5.3 实验结果与分析54-55
  • 5.4 本章小结55-56
  • 结论56-57
  • 参考文献57-61
  • 攻读硕士学位期间所发表的学术论文61-62
  • 致谢62

【引证文献】

中国硕士学位论文全文数据库 前1条

1 吴兰;基于HSA的Kaveri测试与优化[D];苏州大学;2014年



本文编号:941122

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/941122.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户87e59***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com