EDGE处理器中分布式存储结构研究
本文关键词: EDGE处理器 分布式 存储指令队列 出处:《哈尔滨工业大学》2013年硕士论文 论文类型:学位论文
【摘要】:广泛存在的传统集总式结构已经严重限制乱序超标量处理器的性能提升。特别是针对EDGE(Explicit Data Graph Execution)体系结构的微处理器,尽管取指单元、执行单元、寄存器单元都采用了分布式结构,但是,存储指令单元——Load-Store-Queue,仍然是一种集总式的设计结构。这种集总式结构拥有很差的可扩展性特点,限制了相关性检查的处理效率,阻碍了处理器性能的提高。 本文主要通过运用M5-EDGE模拟器,针对集总式Load-Store-Queue的特征进行实现并加以研究分析,评估集总式Load-Store-Queue所面临的诸多问题和缺陷。评估得出,集总式Load-Store-Queue处理效率很低,一次检索项数较多,延时和功耗也相应较高,,并且,可扩展性差,不能一味地与指令窗口数保持对等的项数增加。同时,研究现代应用程序的存储指令相关性特点,发现加速相关指令的执行效率将大大提高处理器性能。 在M5-EDGE模拟器上设计实现分布式Load-Store-Queue结构。使得每个执行单元都包含一个独立的Load-Store-Queue单元。针对甚块动态Deep映射算法,每个甚块独立进行甚块内相关性检查操作,并在流水线递交级进行甚块间的相关性检查.将递交延时和相关性检查延时重叠以减少总延时,并且设计重取指机制以处理甚块间违例的恢复工作。 进行分布式Load-Store-Queue性能评估。相对于集总式结构设计,分布式结构面积并无明显增加,同时,增加相关性检查带宽和减少检查延时,平均效率提高64至256倍,而且也相应的降低了相关性检查的功耗。在综合评估之后,分布式Load-Store-Queue的优势是显而易见的,彻底摒弃了集总式Load-Store-Queue结构的缺点。虽然运行测试程序后发现性能有所降低,这主要是由于重取指的机制带来的性能损害,可以通过其他机制进行优化,而且可优化的策略很多,在充分选择优化策略之后,会对EDGE体系结构微处理器性能产生很好的影响。
[Abstract]:The widespread traditional lumped architecture has severely limited the performance improvement of scrambled superscalar processors. The register unit is distributed, but the memory instruction unit, Load-Store-Queue, is still a lumped structure, which has poor extensibility and limits the processing efficiency of correlation checking. It hinders the improvement of processor performance. In this paper, we use M5-edge simulator to realize and analyze the characteristics of lumped Load-Store-Queue, and evaluate the problems and defects faced by lumped Load-Store-Queue. It is concluded that lumped Load-Store-Queue is very inefficient. The number of items in a single retrieval is more, the delay and power consumption are also higher, and the expansibility is poor, so the number of items can not be kept equal to the number of instruction windows blindly. At the same time, the characteristics of memory instruction correlation of modern application programs are studied. It is found that accelerating the execution efficiency of related instructions will greatly improve processor performance. The distributed Load-Store-Queue structure is designed and implemented on the M5-edge simulator, which makes each execution unit contain an independent Load-Store-Queue unit. For the very block dynamic Deep mapping algorithm, each very block independently performs the very block correlation checking operation. In order to reduce the total delay, we also design a refetch mechanism to deal with the recovery work between the very block violations. To evaluate the performance of distributed Load-Store-Queue. Compared with lumped structure design, the area of distributed structure does not increase significantly. At the same time, it increases the bandwidth of correlation check and reduces the check delay, and the average efficiency is increased 64 to 256 times. After comprehensive evaluation, the advantages of distributed Load-Store-Queue are obvious, and the shortcomings of lumped Load-Store-Queue structure are completely abandoned. This is mainly due to the performance damage caused by the mechanism of reindication, which can be optimized by other mechanisms, and there are many strategies that can be optimized. After the optimization strategy is fully selected, it will have a good impact on the performance of the EDGE architecture microprocessor.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333
【相似文献】
相关期刊论文 前10条
1 王;PowerEdge2300配置灵活,功能强大[J];中国计算机用户;1998年19期
2 Jose Fridman,Zoran Zvonar;Blackfin处理器使EDGE设计更具弹性[J];世界电子元器件;2004年11期
3 ;戴尔推出全新四路PowerEdge服务器及管理软件[J];CAD/CAM与制造业信息化;2005年05期
4 ;新闻[J];电子设计应用;2005年05期
5 ;TTPCom与英特尔的合作关系进一步扩展至EDGE和3G[J];电子技术应用;2004年04期
6 ;西门子选择ADI和TTPCom开发新一代EDGE[J];通信世界;2004年23期
7 付琦;泰克为EDGE提供基站测试功能[J];邮电设计技术;2004年08期
8 叶菊青;上海贝尔阿尔卡特助您轻松晋级EDGE[J];移动通信;2004年09期
9 李志刚;Solid Edge软件学习之我见[J];CAD/CAM与制造业信息化;2005年04期
10 ;Dell新服务器PowerEdge 4200[J];中国青年科技;1997年07期
相关会议论文 前10条
1 Michael A.Foley;;Creating Powerful Systematic Methods,Tools and Datasets for Understanding Human Biology and Disease and Applying Them to Leading-Edge Medical Challenges[A];2011年全国药物化学学术会议——药物的源头创新论文摘要集[C];2011年
2 范灵俊;安述倩;李杨;张浩;王达;范东睿;;众核处理器高效片上访存机制研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
3 迟瑛;;基于GSM的第三代移动通信过渡技术——EDGE[A];第十八届中国(天津)’2004IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2004年
4 万志涛;;基于多核处理器的面向时延敏感服务的云基础架构[A];中国通信学会信息通信网络技术委员会2011年年会论文集(上册)[C];2011年
5 ;Edge Preserving Smoothing for Oblique Images[A];中国科学院地质与地球物理研究所二○○三学术论文汇编·第三卷(地球环境·工程地质与灾害)[C];2003年
6 万志涛;;MIPS指令集多核处理器信令处理能力评估[A];中国通信学会信息通信网络技术委员会2011年年会论文集(上册)[C];2011年
7 扈小燕;刘培洵;陈顺云;刘力强;马瑾;马胜利;;多核处理器环境下遥感数据处理的并行与串行算法的性能比较[A];中国地震学会第14次学术大会专题[C];2012年
8 刘杰;马彦;叶维;高剑刚;;多核处理器存储体系分析[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
9 陈远知;杨帆;;Tilera多核处理器网络应用研究[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
10 季q
本文编号:1546912
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1546912.html