当前位置:主页 > 科技论文 > 计算机论文 >

基于HSA的Kaveri测试与优化

发布时间:2017-10-17 03:16

  本文关键词:基于HSA的Kaveri测试与优化


  更多相关文章: CPU GPU AMD Kaveri 异构系统架构


【摘要】:CPU(Central Process Unit,中央处理器)作为计算机系统的核心部分,从最初的单核CPU,多核CPU,处理器厂商一直通过改进工艺和增加核数的办法来提高处理器的运行速度,但是近些年CPU性能提高遇到了功耗和散热的挑战。同时GPU(Graphic Processing Unit,图形处理器)在计算机系统中从最初的特定功能图形渲染处理器,逐渐发展成可编程的并行处理器,并行计算能力越来越强,能够以很好的性能-功耗比完成通用计算的任务。CPU-GPU的异构计算在此基础上成为最主流的异构架构,以低功耗和强大的并行计算能力获得广泛关注。传统意义上的CPU和GPU是相互独立的器件,必须依靠巨大的编程努力来实现数据传输。AMD公司推出一系列APU(Accelerated Processing Units,加速处理器),将CPU和GPU物理地集成到一起,实现了硬件上的第一次突破。2014年推出了基于HSA(Heterogenous System Architecture,异构系统架构)的APU Kaveri,它从根本上解决了CPU和GPU的数据通信问题,是处理器历史上一次重大突破。 论文分析了Kaveri的主要架构,分别为CPU的核心架构,GPU的最新架构,以及备受瞩目的HSA架构的特性及关键技术hUMA(heterogenous Unified MemoryAccess,异构统一内存访问)和hQ(heterogenous Queue,异构队列)等,探讨了HSA的突破性改进; 使用Kaveri A10-7850K组建计算机系统,并对其系统性能进行软件测试分析,通过软件测试,可以看到与AMD上一代APU Trinity对比,计算性能以及整体性能都有超过20%的提高; 对Kaveri进行HST(Hybrid System Test,混合系统测试)测试,根据产品特性和不同功能模块设定合适的测试项目,设置测试条件,,包括温度,电压等参数。利用Linux下的C++、XML等编程语言生成适合在HST系统运行的测试程序,并进行编译执行。 将HST测试程序进行量产测试,并收集测试结果,对不良比较高的SLT_EXECUTE_TIMEOUT和SLT_GPU_FUNCTIONAL_FAIL两种不同类型的不良品进行分析。通过分析找到产生不良的原因并制定测试的优化方法,制定优化步骤,重新制定测试程序。根据新的测试结果选择新的优化项目,并最终达到高于99%的良率。
【关键词】:CPU GPU AMD Kaveri 异构系统架构
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP332
【目录】:
  • 摘要4-6
  • Abstract6-10
  • 第一章 绪论10-16
  • 1.1 课题的研究背景10-11
  • 1.2 异构计算简介11-13
  • 1.3 国内外的研究现状13-14
  • 1.4 课题的主要工作内容14-16
  • 第二章 Kaveri 架构分析16-27
  • 2.1 Kaveri CPU 及 GPU 的架构16-19
  • 2.1.1 Kaveri CPU 的架构16-17
  • 2.1.2 Kaveri GPU 的架构17-19
  • 2.2 HSA19-26
  • 2.2.1 hUMA20-23
  • 2.2.2 hQ23-26
  • 2.3 本章小结26-27
  • 第三章 异构编程模型27-38
  • 3.1 OpenCL 异构计算27-28
  • 3.2 OpenCL 编程规范28-30
  • 3.3 HSA 架构下的 OpenCL 编程模型30-36
  • 3.3.1 OpenCL 2.0 和 HSA30-32
  • 3.3.2 HSA 编程模型一致性32-33
  • 3.3.3 HSA 队列33-34
  • 3.3.4 HSA 编程接口34-36
  • 3.4 本章小结36-38
  • 第四章 Kaveri 测试与优化38-64
  • 4.1 软件性能测试41-46
  • 4.1.1 通用性能测试42-44
  • 4.1.2 多线程并行运算测试44-45
  • 4.1.3 游戏性能测试45
  • 4.1.4 整体性能测试45-46
  • 4.2 HST 性能测试与优化46-62
  • 4.2.1 HST 测试硬件及程序47
  • 4.2.2 创建 Kaveri 的 HST 测试程序47-48
  • 4.2.3 测试流程生成48-50
  • 4.2.4 程序执行流程50-52
  • 4.2.5 程序编译:52-53
  • 4.2.6 HST 测试结果分析53-54
  • 4.2.7 pk002/004/006 分析54-55
  • 4.2.8 测试优化55-62
  • 4.3 本章小结62-64
  • 第五章 总结与展望64-66
  • 5.1 工作总结64
  • 5.2 工作展望64-66
  • 参考文献66-67
  • 致谢67-68

【共引文献】

中国期刊全文数据库 前2条

1 石林;;关于CPU+GPU异构计算模式程序开发中编程方法研究[J];科学大众(科学教育);2014年10期

2 赵成龙;施慧彬;俞忻峰;;基于OpenCL的双GPU基数排序算法[J];计算机与现代化;2015年01期

中国博士学位论文全文数据库 前4条

1 龙柏;并行计算平台上的数据索引技术研究[D];中国科学技术大学;2011年

2 柴亚辉;基于FPGA的高性能计算架构硬件任务与资源模型研究[D];上海大学;2012年

3 杨蒙召;人体面部真实感快速渲染方法研究[D];哈尔滨工业大学;2014年

4 王强;异构环境下的航空遥感影像协同存储及处理关键技术研究[D];武汉大学;2011年



本文编号:1046482

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1046482.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户62e5e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com