可重构众核流处理器体系结构关键技术研究
发布时间:2019-02-20 07:40
【摘要】:半导体工艺发展进入深亚微米工艺时代后,传统的多核处理器设计面临着功耗、线延迟和可扩展性等诸多问题,制约了传统多核结构处理器性能的提升。另一方面,应用程序运行时对资源的需求呈现差异性和阶段性的特征,固定粒度的处理器设计难以保证在程序运行全过程中资源分配的效率,势必造成资源需求与实际资源分配的不匹配问题。因此,设计一种既符合半导体工艺发展趋势,又能够满足应用程序资源需求阶段性特征的新型处理器结构显得迫在眉睫。 本文从编程模型、重构模式、指令执行模型、指令集以及硬件微结构等方面较为系统地研究了可重构众核结构的相关技术问题,提出并验证了一种基于类数据流驱动模型的可重构众核流处理器结构。研究工作对目前商用流处理器的结构及编程模型进行分析,提炼出可重构众核流处理器的关键技术问题与趋势;在软件层面提出了支持可重构众核流处理器的流程序执行模型,包括流编程模型、重构模式、映射方案以及指令执行模型;在硬件层面提出了分片式的可重构众核流处理器TPA-S,并设计了与之配套的片上二级缓存结构。本文的主要研究内容与所取得研究成果可归纳为以下四个方面: 1.研究了计算密集型应用及流处理模型的特征,提出了适合可重构众核流处理器的流程序执行模型。程序执行模型采用CUDA作为流编程模型,提出并分析了深度优先映射和广度优先映射两种程序映射方案,提出了基于同构物理核的逻辑处理器重构模式,设计了基于超块结构的类数据流驱动的指令执行模型和相应指令集DISC-S. 2.研究了类数据流驱动执行的硬件架构,提出了支持DISC-S指令集的可重构众核流处理器TPA-S设计,实现了逻辑处理器的运行时可重构机制。TPA-S处理器采用了类数据流驱动的执行模型,片上集成了多个拥有独立计算和存储部件的细粒度同构物理核,物理核间采用基于路由节点的二维Mesh结构互连,以数据报文的形式实现不同物理核之间的数据传输,并以物理核为基础构造运算能力更强的粗粒度逻辑处理器。 3.研究了不同硬件配置参数对TPA-S处理器性能的影响,对TPA-S处理器的设计空间进行探索,分析了影响程序在TPA-S处理器上执行性能的关键因素。本文选取了10个真实应用作为Benchmark,考察了TPA-S处理器的执行性能,并对物理核中计算部件和存储部件的配置以及物理核间的片上互连的带宽与延迟等参数对程序执行性能的影响进行了评估。 4.研究并提出了TPA-S处理器上基于UCA架构和Mesh-SNUCA架构的片上 二级缓存系统设计,评估了两种不同架构片上二级缓存的性能表现,探讨了基于Mesh-SNUCA架构的片上二级缓存重构机制。本文在TPA-S模拟器上利用真实应用对UCA架构和基Mesh-SNUCA架构的片上二级缓存系统进行性能评估,还探讨了Mesh-SNUCA架构上片上二级缓存结构的运行时重配置机制,通过在运行时动态修改片上二级缓存与物理核通信接口内部的地址映射表,可实现对片上二级缓存结构的重配置。 本文的研究工作还获得了以下重要认识:(1)不同种类的应用程序对资源的需求差异明显,且同一个程序在执行的不同阶段对资源需求存在阶段性,利用可重构技术可适应这种差异性和阶段性;(2)流处理器可采用类数据流驱动的执行模型,通过超块级的数据流驱动来挖掘指令级并行性;(3)片上互连网络的性能是影响采用分片式设计的可重构众核结构性能的关键因素; 本文提出了一种类数据流驱动的可重构众核流处理器TPA-S,并对其硬件结构、执行模型、编程环境及重构机制等方面的关键技术进行了研究,研究成果可供设计采用众核结构的高性能流处理器参考。
[Abstract]:......
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP332
本文编号:2426956
[Abstract]:......
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP332
【引证文献】
相关期刊论文 前1条
1 王可锋;吴晓;罗眉;;众核多计算模式系统的构建[J];现代电子技术;2013年22期
相关博士学位论文 前1条
1 孙涛;面向动态异构众核处理器的任务调度研究[D];中国科学技术大学;2013年
相关硕士学位论文 前2条
1 孙敏敏;Backprojection成像多核并行计算系统设计[D];南京大学;2013年
2 袁梦羽;深空目标红外光学特性仿真方法研究[D];南京理工大学;2014年
,本文编号:2426956
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2426956.html