当前位置:主页 > 科技论文 > 计算机论文 >

高性能处理器存取关键技术的设计与优化

发布时间:2018-03-29 23:09

  本文选题:高性能处理器 切入点:存取队列 出处:《上海交通大学》2013年硕士论文


【摘要】:随着半导体工艺和计算机体系结构的不断发展,高性能处理器的运行速度和存储器运行速度之间的差异变得愈加明显,成为制约处理器性能提升的因素之一。从指令执行的角度分析,解决存储墙问题就是提高存储指令的执行效率。论文以存取队列为研究突破口,对高性能处理器中的存取关键技术进行了研究和设计。 本论文对高性能处理器中的队列设计和主要的优化方法进行研究,在载入指令重新执行和“存储脆弱窗”算法的基础上,提出新的队列设计方案,称为ESVW。新的设计充分利用载入和存储数据的局部性,进一步降低存储系统被访问的频率。基于相同的设计思路,论文将存取队列和分布式设计的思想引入阵列处理器设计,提出基于存取队列和分布式缓存的处理器架构,充分利用DSP阵列处理器中载入和存储数据的局部性,缓解非规则数据存取操作灵活性差的问题,使存储带宽不再成为性能提升的瓶颈。 论文完成ESVW的RTL设计和逻辑综合,,并对性能、面积等参数进行分析。借助SimpleScalar仿真器和SPEC测试程序,证实ESVW可进一步降低指令访问存储系统的频率,相比于SVW使系统获得约2%的性能提升。论文完成DSP阵列处理器中主要模块的RTL设计、验证和逻辑综合。使用二维离散余弦变换,快速傅里叶变换和FIR滤波等常见算法对存取队列的性能进行评估。结果显示,使用存取队列设计前后,系统获得约5%的性能提升,芯片面积增加4.7%。
[Abstract]:With the development of semiconductor technology and computer architecture, the difference between the speed of high performance processor and the speed of memory becomes more and more obvious. From the perspective of instruction execution, the solution to the problem of storage wall is to improve the efficiency of the execution of storage instructions. The key technology of access in high performance processor is studied and designed. In this paper, queue design and main optimization methods in high performance processors are studied. A new queue design scheme is proposed on the basis of loading instruction reexecution and "memory fragile window" algorithm. The new design is called ESVW.The new design makes full use of the locality of loading and storing data, and further reduces the frequency of accessing storage system. Based on the same design idea, this paper introduces the idea of access queue and distributed design to array processor design. This paper proposes a processor architecture based on access queue and distributed cache, which makes full use of the locality of loading and storing data in DSP array processors, and alleviates the problem of poor flexibility of irregular data access operations. The storage bandwidth is no longer the bottleneck of performance improvement. In this paper, the RTL design and logic synthesis of ESVW are completed, and the parameters such as performance and area are analyzed. With the help of SimpleScalar simulator and SPEC test program, it is proved that ESVW can further reduce the frequency of instruction access to the storage system. Compared with SVW, the performance of the system is improved by about 2%. In this paper, the RTL design, verification and logic synthesis of the main modules of DSP array processor are completed. Some common algorithms such as fast Fourier transform and FIR filter are used to evaluate the performance of access queue. The results show that before and after the design of access queue, the performance of the system is improved by about 5%, and the chip area is increased by 4.7%.
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP332

【相似文献】

相关期刊论文 前10条

1 ;ADI公司发布Blackfin处理器[J];集成电路应用;2005年03期

2 ;给酷睿好看 神舟W230S双核赛扬笔记本电脑[J];数字世界;2008年05期

3 张鹏;;英特尔32nm时代带来了什么?[J];通信世界;2010年10期

4 ;我国千万亿次超级计算机正在加紧研制将首次使用国产龙芯处理器[J];光学仪器;2009年02期

5 ;AMD的“芯”[J];每周电脑报;1997年08期

6 晓顾;;浩鑫AI61主板[J];电脑采购周刊;2000年06期

7 李;;Intel服务器处理器:应对多核与64位挑战[J];电子产品世界;2007年08期

8 ;凌华科技领先发布双四核至强6U CompactPCI高性能处理器板[J];国外电子测量技术;2009年02期

9 胡良校;陈耀强;方滨兴;胡铭曾;;指令级并行之发展与展望[J];计算机科学;1997年04期

10 风;;T1三核DSP针对高端信号处理应用[J];电子设计应用;2008年12期

相关会议论文 前10条

1 李璋辉;倪晓强;王永文;;高性能处理器中ECC纠错码的设计及实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

2 郭磊;唐玉华;周杰;董亚卓;;基于FPGA的Cholesky分解细粒度并行结构与实现[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

3 张琦滨;李强;;Pshare两级自适应分支预测算法及实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年

4 熊荫乔;谭庆平;徐建军;;基于软件标签的软错误校验和恢复技术[A];中国通信学会第六届学术年会论文集(上)[C];2009年

5 包丽红;吴碧伟;朱平;;安全存储部件研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

6 赵德志;章勇;廖书红;;嵌入式Linux及BOA服务器在S3C2410上的移植[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年

7 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

8 李腾飞;向东;;细粒度无死锁路由算法Opt-DP下二维NoC路由器内部机制[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年

9 杨朱黎;赵振宇;张民选;刘战涛;王思威;;一种40nm工艺32相位时钟发生器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

10 唐茜茜;刘衡竹;郭海勇;;65nm工艺下32位PC加法器的设计与应用[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

相关重要报纸文章 前10条

1 ;成电先锋SR2600系列简单实现 方便管理[N];中国计算机报;2002年

2 记者 潘若o

本文编号:1683261


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1683261.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d7988***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com