当前位置:主页 > 科技论文 > 计算机论文 >

分簇超标量处理器关键技术研究

发布时间:2020-05-07 11:52
【摘要】:随着数字技术的持续发展和半导体工艺的进步,在新的工艺条件下,超大规模集成电路设计正面临着新的问题。对于处理器设计而言,一方面由于影响处理器设计的线延迟、存储器访问延迟、功耗、设计复杂度、设计开销等问题愈发严重;另一方面,人们对计算能力的要求平均以每年80%左右的速度递增。而传统的微处理器结构由于过多地使用了集总式部件而导致可扩展性较差,已不能适应当前的技术、经济发展要求。在这种情况下,一系列新型的处理器结构应运而生,分簇超标量处理器正是其中之一。分簇超标量处理器通过将超标量中的集总式部件用协同工作的基本同构(或模块化)的多个小部件(簇)来代替,,并对协作的方法进行了特别的关注,使得分簇超标量处理器在面积、功耗、设计复杂度、设计开销减少时,能够获得接近、达到、或超过原有的集总的超标量处理器的性能,并且具有较好的可扩展性。 文章首先对影响分簇超标量性能的关键因素——指令分派算法进行了深入研究。分析了若干经典的分派算法,并对分簇大小、指令队列大小、簇间通信延迟、指令队列的分派端口以及重试策略对分派算法的影响进行了详细的研究。基于上述分析结果,指出不同分派算法的性能随仿真条件的变化差异巨大。由于经典的相关性算法在负载均衡上还有扩展空间,以及无需给相关性算法提供与取指宽度相同数量的分派端口以满足最坏情况,提出了一种基于限制分派端口数目以进行强制均衡策略的LA分派算法。该算法将经典的DCOUNT算法中累积性的一次性负载均衡分散到多点、多次,性能与DCOUNT算法相当,降低了硬件复杂度和面积开销。 在对Fields的程序相关图进行改进的基础上,提出了一种在线关键路径分析框架,该框架能快速有效地分析分簇超标量处理器的性能瓶颈。将该框架集成到仿真器中,进行了处理器的CPI分析、指令的关键性研究等工作。 在分析分布式寄存器堆结构和拷贝指令特点的基础上,提出了一种分簇超标量处理器微结构。该结构使用了一种新的分布式重命名机制,该机制对重命名级进行了分簇,减少了硬件开销,提升了处理器的扩展性;研究了拷贝指令给分簇超标量的指令调度和执行带来的影响,提出了一种使用拷贝指令附加信息的指令队列结构。该指令队列相对于任何使用单独拷贝指令队列的情况,在1x8的结构下,整数性能至少上升了2.5%,浮点性能至少持平;相对于拷贝指令跟正常指令争用资源的情况,整数性能上升26.2%,浮点上升59.7%。 论文提取并分析了分簇超标量处理器中点对点标量网络的通信特征,指出了其显著特点在于较低的负载特性和较均匀的负载分布。通过一种可配置网络平台对标量网络的网络性能进行了仿真与评估,确定了标量网络及其路由器设计的优化策略,提出了一种适用于分簇超标量处理器的点对点标量网络,采用两套配置相同、共用控制逻辑的网络,分别传输标签与操作数。其中路由器具有设计简单、无流控机制、具有旁路机制等特点。使用该标量网络,处理器能够达到与理想总线相近的性能,比使用SynNet的处理器性能平均提升了5.8%。 分簇超标量处理器中Cache的性能依然是处理器的瓶颈,通过给每个簇配置一个私有的快速投机L0Cache的方法,较好地抵消了下级Cache的访问延迟。通过给L0Cache加入读更新和固定读长度的方法,在保证足够的正确率的同时,较文献中的L0Cache结构的读命中率增加了44.8%。仿真结果显示,在8簇的分簇处理器中,每簇采用4KB2路组相连分簇L0Cache后,处理器性能平均提升5.6%,在部分测试程序中达到20%以上,较文献中的L0Cache性能提升3.1%。
【图文】:

导体,动态功耗,单芯片,工艺水平


图 1-1 ITRS 对半导体业的预测[2]Figure 1-1 ITRS product technology trend[2]图 1-2 单个周期内能访问的芯片面积[6]Figure 1-2 Fraction of chip reached in one clock[6]ll:工艺水平的提高可以让单芯片集成更多的晶,同时也意味着更大的动态功耗。另外,连线为了芯片功耗的重要组成部分。而经济因素、

内能,周期,功耗,散热技术


- 2 -图 1-2 单个周期内能访问的芯片面积[6]Figure 1-2 Fraction of chip reached in one clock[6]:工艺水平的提高可以让单芯片集成更多的,同时也意味着更大的动态功耗。另外,连线为了芯片功耗的重要组成部分。而经济因素、芯片散热技术等多方面的限制,为每个芯片定导体工业协会(Semiconductor Industry Asso耗的预计。可以看出处理器中允许的功耗并不律。如何在功耗约束下到达性能目标,成为微
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP332

【相似文献】

相关期刊论文 前10条

1 王海涛;分簇结构在Ad Hoc网络中的应用综述[J];重庆邮电学院学报(自然科学版);2003年04期

2 张宁;;超级计算机技术史话[J];大众硬件;2006年11期

3 李祖松;许先超;胡伟武;唐志敏;;龙芯2号处理器的同时多线程设计[J];计算机学报;2009年11期

4 隋秀峰;吴俊敏;陈国良;;同时多线程处理器上的Cache性能分析与优化[J];小型微型计算机系统;2009年01期

5 屈文新;樊晓桠;张盛兵;;多核多线程处理器存储技术研究进展[J];计算机科学;2007年04期

6 张浩;钱学海;;自修改代码在Godson-X上的处理实现[J];计算机工程;2008年03期

7 许琼方;;传感器网络分簇协议的分析与比较[J];科技风;2008年12期

8 王新生;张云超;梁平;潘书芹;;基于拓扑结构和节点性能的应用层组播算法[J];计算机工程;2010年15期

9 王毅;董梁;梁涛涛;杨新宇;张德运;;分簇覆盖的移动自组织网中节点位置辅助路由算法(英文)[J];软件学报;2009年11期

10 宁永波;李谦;李强;张琦滨;;一种基于数据相关性的乱序处理器验证方法[J];电脑知识与技术;2011年04期

相关会议论文 前10条

1 郑启龙;汪胜;夏霏;;DSP编译器中一种基于子图的分簇算法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年

2 张强;夏艳;龚正虎;;一种基于信誉评估与能量辅助约束的混合MANET分簇协议[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年

3 王新生;郭晓丹;尹晓鹏;;基于簇的移动Ad Hoc网络入侵检测系统研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年

4 马振;孙季丰;;一种基于能量效率的WSN多跳簇生成算法[A];第三届全国嵌入式技术和信息处理联合学术会议论文集[C];2009年

5 张海明;马立香;;基于FH-TDMA信道的网间互联模型分析[A];2006中国西部青年通信学术会议论文集[C];2006年

6 林颖;许力;林晖;;分簇无线传感器网络中最小退避窗口自适应机制[A];2009年通信理论与信号处理学术年会论文集[C];2009年

7 吴建荣;万健;徐向华;;定向扩散路由协议的改进分析[A];浙江省电子学会2008年学术年会论文集[C];2008年

8 祝颖;徐红兵;肖俊;;能量高效的异类无线传感器网络分簇算法研究[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年

9 张维勇;张芬;马学森;;基于IEEE802.15.4的一种分簇算法研究[A];第二十六届中国控制会议论文集[C];2007年

10 曾明;胥布工;;基于分层的传感器网络自组织拓扑控制算法研究[A];第二十七届中国控制会议论文集[C];2008年

相关重要报纸文章 前10条

1 邱峰、陈寅初;ATi的新一代杀手锏RADEON 9700 Pro[N];中国计算机报;2002年

2 本报记者 程鸿;“抗争”高性能计算[N];计算机世界;2003年

3 ;Athlon 64芯片组市场捷报频传[N];中国电脑教育报;2005年

4 本报记者 张广彬;从sasi到SCSI[N];计算机世界;2002年

5 ;SLI 加入Intel阵营[N];中国电脑教育报;2005年

6 炮无烟XT;数据仓库大升级[N];计算机世界;2004年

7 一笑;AMD的杀手锏:Barcelona处理器[N];中国计算机报;2007年

8 刘洪宇;IBM POWER6节能技术[N];中国计算机报;2008年

9 张翼;关于未来的更多细节[N];中国电脑教育报;2004年

10 福倩;万全为IA64助力[N];计算机世界;2001年

相关博士学位论文 前10条

1 杨兵;分簇超标量处理器关键技术研究[D];哈尔滨工业大学;2009年

2 王衡军;基于分簇的战术互联网安全关键技术研究[D];解放军信息工程大学;2010年

3 倪e

本文编号:2652930


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2652930.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9e08c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com