当前位置:主页 > 科技论文 > 计算机论文 >

三维处理器中计算资源动态共享技术研究

发布时间:2018-07-05 06:07

  本文选题:多核 + 硅通孔 ; 参考:《国防科学技术大学》2012年硕士论文


【摘要】:随着半导体工艺尺寸步入深亚微米和纳米级别,尺寸的缩减逐渐接近物理极限。通过提升主频来提高处理器性能的发展方向已经停滞,微处理器体系结构研究和实现转移到采用多核与众核结构提高性能的道路上。但多核与众核结构并未解决功耗墙、存储墙、片上互连延迟增加等问题,并使之进一步恶化,阻碍了微处理器性能的进一步提高。 三维处理器通过采用三维集成电路技术使硅片与硅片上下直接堆叠,从而以较低成本获得更多硅片资源,进而可以集成更多缓存来解决存储墙问题。连接不同堆叠层次硅片的硅通孔具有低延迟、高通信带宽等特性,可以用来解决纳米工艺全局连线的问题。 传统多处理器和多计算机上的负载不均衡问题在三维多核处理器中也存在。由于三维处理器资源众多,,部分核由于负载重导致部分资源成为性能瓶颈,而同一时刻其他核计算资源处于闲置状态的场景更加常见。 针对传统二维多处理器中核间共享资源面临的共享资源粒度粗、互连延迟长、可扩展性差等问题,本文提出了一种新的资源交叉的三维处理器结构3DDRS,该结构考虑了功耗与散热平衡,同时支持计算资源动态共享。针对未来三维处理器更多层次堆叠和多种数量核心共享资源的需求,提出了3DDRS结构针对多核三维处理器的扩展原则,同时提出了计算资源共享的关键技术。 由于多任务执行模式的一致性,本文在同时多线程模拟器SMTSIM的基础上扩展3DDRS的性能模拟工具3DDRS-SIM。在3DDRS-SIM中重点实现了3DDRS结构中动态共享计算资源的原理,并支持对多堆叠层次的资源共享的性能模拟。使用3DDRS-SIM对3DDRS结构面临计算密集型单任务和多任务应用的性能进行了评估。实验结果表明,基于多种计算资源共享的3DDRS结构,使三维处理器的单线程最高性能平均提升23%,整体性能平均提升12%。 三维处理器结构3DDRS中多个堆叠层次计算资源的共享技术,能够动态适应负载的资源需求,提升简单众核设计下单线程应用计算的性能和处理器的整体性能,是未来三维处理器设计的良好备选。
[Abstract]:As semiconductor process size steps into deep sub-micron and nano-scale, the size reduction is gradually approaching the physical limit. The development direction of improving processor performance by raising the main frequency has been stalled. The research and implementation of microprocessor architecture has been shifted to the path of improving performance by adopting multi-core and multi-core architecture. However, the multi-core and multi-core architecture has not solved the problems of power wall, storage wall, on-chip interconnect delay and so on, which further worsen and hinder the further improvement of microprocessor performance. By using 3D integrated circuit technology to stack up and down the silicon chip directly, the 3D processor can acquire more silicon chip resources at lower cost, and then integrate more buffers to solve the storage wall problem. The silicon through holes connected to different stacked layers of silicon have the characteristics of low delay and high communication bandwidth, which can be used to solve the problem of global connection in nanotechnology. Traditional multi-processor and multi-computer load imbalance problems also exist in three-dimensional multi-core processors. Due to the large number of 3D processor resources, part of the core due to heavy load leads to part of the performance bottleneck, while other computing resources at the same time is more common in the idle state scenario. Aiming at the problems of coarse-grained shared resources, long interconnect delay, poor scalability and so on, the traditional two-dimensional multi-processor system is faced with shared resources among cores. In this paper, a new 3D processor architecture, 3DDRSs, is proposed, which takes into account the balance between power consumption and heat dissipation, and supports dynamic sharing of computing resources. In order to meet the need of multilevel stacking and multiple core sharing resources in future 3D processors, the expansion principle of 3DDRS architecture for multi-core 3D processors is proposed, and the key technology of computing resource sharing is also presented. Because of the consistency of multitask execution mode, this paper extends the 3DDRS performance simulation tool 3DDRS-SIMs based on the simultaneous multithreading simulator SMTSIM. The principle of dynamically sharing computing resources in 3DDRS architecture is implemented in 3DDRS-SIM, and the performance simulation of multi-stack level resource sharing is supported. The performance of 3D DDRS architecture facing computationally intensive single-task and multi-task applications is evaluated using 3DDRS-SIM. The experimental results show that based on the 3DDRS architecture of multi-computing resource sharing, the single thread maximum performance of 3D processor is increased by 23 per thread on average, and the overall performance is increased by an average of 12. The sharing technology of multi-layer computing resources in 3D processor architecture 3DDRS can dynamically adapt to the resource requirements of the load and improve the performance of the simple multi-core design send order thread application computing performance and the overall performance of the processor. It is a good candidate for future 3D processor design.
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP332

【相似文献】

相关期刊论文 前10条

1 C.A.(Al)Dennis ,陈瑞源 ,力康;公用信号处理器的应用和设计[J];系统工程与电子技术;1987年06期

2 Robert Cravotta;;可配置处理器应用日趋红火[J];电子设计技术;2003年11期

3 刘磊;邹候文;唐屹;;一种可编程安全处理器体系结构的研究与实现[J];广州大学学报(自然科学版);2006年04期

4 张铮;赵荣彩;颜峻;邰铭;陈科;;网络处理器体系结构和应用综述[J];信息工程大学学报;2006年04期

5 张怡,孙志刚;基于IPSec的下一代高性能安全处理器的体系结构[J];国防科技大学学报;2003年02期

6 岳虹;戴葵;王志英;;一种面向数字信号处理的嵌入式处理器体系结构设计[J];计算机工程与科学;2006年10期

7 许珊琳;;适合嵌入应用的嵌入式处理器[J];中国集成电路;2009年02期

8 张磊;王颖;陈云霁;徐志伟;张立新;;可重塑处理器:用户可定义的加速器中处理器架构[J];网络新媒体技术;2012年06期

9 Robert Cravotta;;一个处理器能兼顾控制与信号处理吗?[J];电子设计技术;2002年07期

10 朱丹;李暾;郭阳;李思昆;;微处理器体系结构级测试程序自动生成技术[J];软件学报;2005年12期

相关会议论文 前3条

1 宋绯;刘晓宁;;DSP/MCU结构的新型处理器[A];第九届全国青年通信学术会议论文集[C];2004年

2 赵秋平;杨灿群;王锋;;LBM算法在Cell处理器上的实现和优化[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

3 周巍;孙冰;战立明;吕建华;王国仁;于戈;;基于DOM模型的XML查询处理器的设计与实现[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

相关重要报纸文章 前10条

1 ;处理器上演多核大戏[N];计算机世界;2005年

2 心元;PC“心脏”的搏击[N];计算机世界;2004年

3 清华大学微处理器与SoC技 术研究中心 王海霞 汪东升;颠覆传统理念[N];计算机世界;2005年

4 清华大学微处理器与SoC技术研究 中心 汪东升 王海霞 张悠慧 李兆麟;CMP 开启处理器效能时代[N];计算机世界;2005年

5 江苏 netfan;体现速度与性能[N];电脑报;2004年

6 四川 王毅;变革进行时[N];电脑报;2004年

7 清华大学微处理器与SoC技术研究中心 汪东升;多核技术天地广阔[N];计算机世界;2006年

8 本报记者 李献 王皓;2002年服务器四大景观[N];计算机世界;2003年

9 ;MontaVista Linux 2.1跨平台[N];中国计算机报;2002年

10 ;CPU技术进步牛气冲天[N];计算机世界;2004年

相关博士学位论文 前10条

1 魏继增;可配置可扩展处理器关键问题研究[D];天津大学;2010年

2 霍文捷;嵌入式处理器安全运行机制的研究与设计[D];华中科技大学;2010年

3 从明;类数据流驱动的分片式处理器体系结构[D];中国科学技术大学;2009年

4 徐光;分片式流处理器体系结构[D];中国科学技术大学;2010年

5 李勇;异步数据触发微处理器体系结构关键技术研究与实现[D];国防科学技术大学;2007年

6 任永青;逻辑核动态可重构的众核处理器体系结构[D];中国科学技术大学;2010年

7 黎铁军;嵌入式流媒体处理器体系结构技术研究[D];国防科学技术大学;2005年

8 黄海林;高可靠处理器体系结构研究[D];中国科学院研究生院(计算技术研究所);2006年

9 刘光辉;高效处理器容错技术研究与实现[D];国防科学技术大学;2013年

10 温璞;面向科学计算的PIM体系结构技术研究[D];国防科学技术大学;2007年

相关硕士学位论文 前10条

1 曾斌;分片式处理器体系结构上的超块优化技术[D];中国科学技术大学;2009年

2 黄冕;X处理器存储一致性模型的研究与实现[D];国防科学技术大学;2008年

3 赵灿明;分片式处理器上激进执行模型分析[D];中国科学技术大学;2009年

4 刘晋汾;处理器描述语言的研究与应用[D];解放军信息工程大学;2011年

5 刘子扬;基于虚拟计算群的众核处理器动态在线任务调度算法研究[D];上海交通大学;2013年

6 邸志雄;多核包处理器数据控制总线技术研究[D];西安电子科技大学;2010年

7 方红霞;基于指令的处理器时延测试产生方法[D];中国科学院研究生院(计算技术研究所);2005年

8 黎宝峰;嵌入式DSP处理器的设计与验证[D];湖南大学;2003年

9 钟松延;可配置可扩展处理器编译器设计[D];天津大学;2012年

10 董亚卓;循环阵列处理器体系结构的关键技术研究与实现[D];国防科学技术大学;2004年



本文编号:2099232

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2099232.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户994a7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com