集成CPU-GPU架构上的列存储连接优化技术研究
发布时间:2017-03-26 03:06
本文关键词:集成CPU-GPU架构上的列存储连接优化技术研究,由笔耕文化传播整理发布。
【摘要】:随着互联网时代的到来,企业数据爆发式增长。如何更好地支持海量数据的存储、分析,已经成为企业关注的重要问题。数据仓库是用来存储、分析海量数据的重要工具。传统关系型数据库以事务操作为核心,而数据仓库更注重对海量数据的存储、查询与分析。相比于行存储技术,列存储技术因其在读优先环境中的优势,被更多的应用于数据仓库之中。由于列存储系统可以支持列的独立存储、压缩和其他操作,列存储更利于读优化操作。集成多核异构CPU-GPU架构已经成为计算机处理器芯片的发展趋势,在商用计算机中,基于集成多核异构CPU-GPU架构的中央处理器已经得到了较为广泛的应用。在这种趋势下,研究数据仓库软件如何利用集成多核异构CPU-GPU体系架构处理器的性能优势极具价值。本文主要研究集成多核异构CPU-GPU架构处理器上列存储系统的连接原语优化技术,并以我们实验室自主研发的列存储系统为基础,研究了如何利用集成多核异构CPU-GPU架构的计算资源和性能优势优化连接操作。主要工作如下:本文首先研究了基于列存储系统的并行连接算法,针对OpenCL编程框架的特点,设计并实现了基于OpenCL的列存储系统连接算法。除此之外,研究了GPU上的数据分组算法,并针对该算法空间开销较大的问题做了相应改进,提出了一种基于分组数统计的GPU数据分组算法。其次,对使用GPU作协处理器加速数据查询操作的方法进行了研究。之后,深入研究了基于集成CPU-GPU架构的流水线协处理方案,并针对其无法动态改变数据配比的问题,提出了一种动态数据分配策略。再次,研究了实验室自主研发的列存储系统,并对其作出了改进,将本文提出的数据分配策略集成到该系统之上,使其可以充分利用集成CPU-GPU架构处理器的计算资源,优化连接操作。最后,使用SSB测试基准,验证了本文提出的方法有效性。实验结果表明,本文提出的方法使得两表连接效率最大提高了33.2%,SSB测试基准的标准查询语句Q1.1的执行时间缩短了9.81%,Q3.1执行时间最高缩短了7.03%。
【关键词】:异构芯片 数据预取 查询优化 并行连接算法 OpenCL
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP332
【目录】:
- 摘要4-6
- ABSTRACT6-10
- 第一章 绪论10-15
- 1.1 研究背景10-11
- 1.2 研究现状11-13
- 1.3 研究内容与主要贡献13
- 1.4 论文组织结构13-15
- 第二章 相关技术介绍15-24
- 2.1 集成CPU-GPU架构15-17
- 2.2 CPU、GPU协同处理在数据库查询中的应用17-18
- 2.3 OpenCL18-23
- 2.4 本章小结23-24
- 第三章 基于OpenCL的并行连接算法设计24-31
- 3.1 基于分组统计的并行数据分组算法24-26
- 3.2 基于OpenCL的并行循环嵌套连接26-27
- 3.3 基于OpenCL的并行哈希连接算法27-28
- 3.4 基于OpenCL的并行排序归并连接28-30
- 3.5 本章小结30-31
- 第四章 集成CPU-GPU平台上的协处理方案设计31-41
- 4.1 流水线执行式协同处理方案的设计31-33
- 4.2 现有流水线执行式协同处理方案的不足33-35
- 4.3 环境敏感的协处理数据分配策略35-39
- 4.4 连接算法的细粒度划分39-40
- 4.5 本章小结40-41
- 第五章 列存储系统中协处理加速并行连接的实现41-52
- 5.1 协处理方案的实现41-47
- 5.2 并行连接的实现47-51
- 5.3 本章小结51-52
- 第六章 实验设计与结果分析52-61
- 6.1 实验环境52
- 6.2 数据集52-53
- 6.3 连接原语性能分析53-56
- 6.4 协处理机制性能分析56-61
- 第七章 总结及展望61-62
- 7.1 总结61
- 7.2 展望61-62
- 参考文献62-66
- 攻读学位期间的研究成果目录66-67
- 致谢67
【参考文献】
中国期刊全文数据库 前1条
1 卢风顺;宋君强;银福康;张理论;;CPU/GPU协同并行计算研究综述[J];计算机科学;2011年03期
本文关键词:集成CPU-GPU架构上的列存储连接优化技术研究,由笔耕文化传播整理发布。
,本文编号:268174
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/268174.html