GPGPU多核流体系结构与功耗模拟研究
发布时间:2021-08-23 13:27
随着微处理器技术的不断进步,单芯片多核处理器已成为微处理器发展的主流。其中,多核流处理器不但展现出巨大的计算性能潜力,而且在面积利用率、平均功耗和可编程灵活性上也有着显著的优势。GPGPU作为简单多核流处理器的典型代表,对数据密集型和高度并行性的计算进行加速能够获得显著的效果,在科学计算和工程领域有着广泛的应用。通过研究GPGPU的体系结构,可以探索体系结构的未来发展方向,为自主研制高性能的通用流处理器提供可借鉴的思路。模拟器是研究处理器体系结构的一种有效手段。GPGPU的简单多核流体系结构作为一种新型的体系结构,既有多核处理器结构特征,又有流体系结构特征,与传统的微处理器体系结构有着很大的不同,需要研究新的模拟技术和方法。为此,本文对目前在学术界广泛使用的NVIDIA公司的GPGPU进行了相关研究。本文通过研究GPGPU的发展和及其体系结构的典型特点,并结合GPGPU的编程模型CUDA和多线程流执行模式,详细探讨了GPGPU多核流体系结构模拟器的主要思想。本文充分利用了现有模拟器GPGPU-Sim的实现技术和方法,通过软件扩展和功能完善,结合功耗模拟器Wattch的应用接口和算法,建...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
传统的GPU计算模型
图 2.1 传统的 GPU 计算模型2006 年,NVIDIA 推出的 GeForce 8800 图形处理器是第一款基于 G80 GPU。G80 体系结构使用统一着色单元取代了分离的顶点和像素处理了共享存储器,而其编程方式 CUDA(Compute Unified Device Archite为友好,如图 2.2,程序员可以利用 C 语言直接在 GPU 上进行程序设需要依赖 Direct 3D 或 OpenGL 等语言,极大地简化了利用 GPU 进行难度。2008 年,NVIDIA 推出了基于 GT200 结构的 GPU。GT200 体系体系结构的基础上进行了相应改进,主要表现为加入了对共享存储器和双精度浮点运算的支持,并放宽了对存储器的对齐访问。
图 2.3 G80 体系结构SPA 在组成上又可以分为两层:第一层由若干个 TPC 组成(Thread ProcessingCluster,线程处理器簇),第二层由多个 SM(Stream Multiprocessor,流多处理器)和一条共用的纹理流水线组成,纹理流水线为 TPC 内的所有 SM 提供计算所需要的数据。
【参考文献】:
期刊论文
[1]纳米级工艺下多处理器功耗评估与优化技术[J]. 张戈,张量,杨荣秋. 中国集成电路. 2008(07)
[2]多核、多线程处理器的低功耗设计技术研究[J]. 张骏,樊晓桠,刘松鹤. 计算机科学. 2007(10)
[3]低功耗数字系统设计方法[J]. 梁宇,韩奇,魏同立,郑茳. 东南大学学报(自然科学版). 2000(05)
硕士论文
[1]模式识别并行算法与GPU高速实现研究[D]. 张舒.电子科技大学 2009
本文编号:3357955
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
传统的GPU计算模型
图 2.1 传统的 GPU 计算模型2006 年,NVIDIA 推出的 GeForce 8800 图形处理器是第一款基于 G80 GPU。G80 体系结构使用统一着色单元取代了分离的顶点和像素处理了共享存储器,而其编程方式 CUDA(Compute Unified Device Archite为友好,如图 2.2,程序员可以利用 C 语言直接在 GPU 上进行程序设需要依赖 Direct 3D 或 OpenGL 等语言,极大地简化了利用 GPU 进行难度。2008 年,NVIDIA 推出了基于 GT200 结构的 GPU。GT200 体系体系结构的基础上进行了相应改进,主要表现为加入了对共享存储器和双精度浮点运算的支持,并放宽了对存储器的对齐访问。
图 2.3 G80 体系结构SPA 在组成上又可以分为两层:第一层由若干个 TPC 组成(Thread ProcessingCluster,线程处理器簇),第二层由多个 SM(Stream Multiprocessor,流多处理器)和一条共用的纹理流水线组成,纹理流水线为 TPC 内的所有 SM 提供计算所需要的数据。
【参考文献】:
期刊论文
[1]纳米级工艺下多处理器功耗评估与优化技术[J]. 张戈,张量,杨荣秋. 中国集成电路. 2008(07)
[2]多核、多线程处理器的低功耗设计技术研究[J]. 张骏,樊晓桠,刘松鹤. 计算机科学. 2007(10)
[3]低功耗数字系统设计方法[J]. 梁宇,韩奇,魏同立,郑茳. 东南大学学报(自然科学版). 2000(05)
硕士论文
[1]模式识别并行算法与GPU高速实现研究[D]. 张舒.电子科技大学 2009
本文编号:3357955
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3357955.html