基于Alpha的分簇超标量处理器IU单元的设计
发布时间:2020-10-20 18:52
为了充分开发程序的指令级并行性以提高每周期完成指令数,当今的高性能超标量处理器普遍采用了较大的发射宽度。然而,随着处理器发射宽度的增大,流水线中物理寄存器组、指令发射逻辑和旁路逻辑等一些关键部件的硬件复杂度迅速增加,导致连线长度和延迟时间也随之增大,特别是当工艺线宽越来越小时,连线延迟成为阻碍处理器性能提高的瓶颈。另外,功耗和面积也随发射宽度增大呈平方趋势上升。可见,在传统的超标量处理器结构基础上简单地增大发射宽度需要较大的代价。而通过将这些关键部件分簇,每个簇只需支持较小的发射宽度能够改善延迟、功耗和面积等问题,由于流水线发射宽度为各簇发射宽度的总和,所以分簇不会减少总的发射宽度。 本论文完成了一个64位11级流水线的分簇超标量处理器的设计。论文设计了包括复合分支预测、重命名等技术的高性能处理器前端,高准确度的分支预测器能够减少分支误预测对流水线性能的影响,而重命名技术能够去除指令间的伪相关,充分开发指令级并行度。另外,设计了分簇的处理器后端,分簇设计考虑到以下几个方面:为了减小指令分派逻辑的复杂度,本文采用两个同构的簇;每个簇内部结构包括指令发射逻辑、物理寄存器组、旁路逻辑以及4个执行单元;为了平衡各簇负载,本文设计了模3的指令分派逻辑;执行结果通过交叉互连线广播到另外一个簇实现簇间通信。最后,本文建立仿真平台并验证了所设计处理器的基本功能。
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2007
【中图分类】:TP332
【部分图文】:
Alpha21264流水线结构
哈尔滨工业大学工学硕士学位论文图2-3 处理器结构Figure 2-3 Architecture of the processor与 Alpha 21264 类似,本文设计的处理器也包含两个簇,但有别于 Alpha21264 的是,本文的处理器将发射段也进行分簇,以减少每个簇指令调度的宽度,降低发射逻辑的复杂度,从而减少延迟时间;而且指令分派策略也有所不同,Alpha 21264 采用随机的指令分派策略,而本文处理器采用了 MOD3的指令分派策略以达到平衡负载的目的,这种策略就是向同一个簇中分派 3 条连续的指令,然后再换下一个簇;另外,Alpha 21264 是双簇异构结构
XextPCN图2-4 取指段结构Figure 2-4 Fetch stage block diagram为了获得尽可能高的分支预测准确度,该处理器中采用了复合分支预测器(Combining Branch Predictor),如图中的虚线框所示。由于该分支预测器硬件结构复杂,延迟时间很大,如果在单个周期内实现可能会成为整个流水线的关键路径,从而降低整个工作速度,因此它被分为两级流水。但两级流水的分支预测又会带来新的问题:如果分支指令要等两个周期才能预测出它的分支方向,则必须在分支指令后插入一个流水气泡。为了解决上述问题,我们在取指令的第一级使用一个简单的分支预测器—双峰分支预测器,将它和分支目标缓冲(Branch Target Buffer
【参考文献】
本文编号:2849032
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2007
【中图分类】:TP332
【部分图文】:
Alpha21264流水线结构
哈尔滨工业大学工学硕士学位论文图2-3 处理器结构Figure 2-3 Architecture of the processor与 Alpha 21264 类似,本文设计的处理器也包含两个簇,但有别于 Alpha21264 的是,本文的处理器将发射段也进行分簇,以减少每个簇指令调度的宽度,降低发射逻辑的复杂度,从而减少延迟时间;而且指令分派策略也有所不同,Alpha 21264 采用随机的指令分派策略,而本文处理器采用了 MOD3的指令分派策略以达到平衡负载的目的,这种策略就是向同一个簇中分派 3 条连续的指令,然后再换下一个簇;另外,Alpha 21264 是双簇异构结构
XextPCN图2-4 取指段结构Figure 2-4 Fetch stage block diagram为了获得尽可能高的分支预测准确度,该处理器中采用了复合分支预测器(Combining Branch Predictor),如图中的虚线框所示。由于该分支预测器硬件结构复杂,延迟时间很大,如果在单个周期内实现可能会成为整个流水线的关键路径,从而降低整个工作速度,因此它被分为两级流水。但两级流水的分支预测又会带来新的问题:如果分支指令要等两个周期才能预测出它的分支方向,则必须在分支指令后插入一个流水气泡。为了解决上述问题,我们在取指令的第一级使用一个简单的分支预测器—双峰分支预测器,将它和分支目标缓冲(Branch Target Buffer
【参考文献】
相关期刊论文 前1条
1 邓正宏,康慕宁,罗旻;超标量微处理器研究与应用[J];微电子学与计算机;2004年09期
本文编号:2849032
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2849032.html