当前位置:主页 > 科技论文 > 计算机论文 >

面向低功耗的多核多线程架构研究

发布时间:2017-05-15 23:14

  本文关键词:面向低功耗的多核多线程架构研究,由笔耕文化传播整理发布。


【摘要】:制造工艺的持续发展,为芯片提供了指数级增长的可用晶体管,单个芯片上甚至可以容纳数10亿个晶体管,因而处理器能耗和热密度逼近其物理极限,成为限制处理器性能提升的主要瓶颈。如何组织利用这些晶体管资源,将之转化为适应未来应用的有效计算性能成为一个的难题。线延时相对开关延时的不断增加,芯片热密度逼近制冷极限,线路的复杂性使得简单增加现有处理器的设计成为泡影,设计人员不得不放弃传统通过增加单芯片性能的方式,转而采用多核架构提升处理器的性能。同时,已有的研究表明不同应用对资源的需求存在较大差异,通过资源重构可以获得显著的效益。近年来,有关多核多线程的动态重构成为该领域中的一个研究热点。本文对基于多核多线程架构的动态资源管理进行了深入的研究,主要工作包括: (1)通过阅读多核多线程领域专家的文献和相关的技术文档,本文对CMP、SMT、细/粗粒度多线程等多核结构及亟待解决的关键问题以及各种架构的优劣等各方面进行了系统的分析和阐述。在实际的处理器产品中,通常不会只采用某种单一的处理架构,而采用多种架构混合的方式,以达到处理器与多级Cache及存储的最佳匹配,根据当前商用处理器的结构,CMP与SMT的混合架构将在很长一段时间占据处理器领域的主流位置。 (2)目前,关于SMT的资源重分配算法主要有以下几种,以L1/L2Cache的缺失率或者系统的IPC为重划分指标,控制数据通路资源在不同线程之间的分配;或者通过多种分配方案测试,动态追踪系统需求的最佳资源匹配。这两种方案或分配算法与目标相关性不大,或需要很长时间才能找到最佳分配方案。本文中提出以资源利用率为衡量标准,并设置线程的资源吸收壁,保证线程免于饥饿。 (3)核内资源动态管理大都限于SMT处理器,但SMT不具有扩展性,直接移植到其它架构中效果往往不如人意。本文中提出一种基于CMT架构的动态资源管理算法,该方案能够动态的调整线程的资源分配量,在保证性能基础上考虑关闭多余资源,以达到节能降耗目的,并综合考虑了多核多线程结构对系统的总体吞吐量的影响。为了更准确的验证本文提出的动态重构方案,使用Simics和GEMS模拟出全系统SPARC平台,,并用SPEC OMP基准测试程序验证。结果表明在4核*4线程环境下,我们的方案比传统静态划分方案的功耗降低了18.13%,同时性能提升40.1%。
【关键词】:多核多线程 乱序缓冲区 动态重构 低功耗 片上多线程
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP332
【目录】:
  • 摘要4-5
  • Abstract5-7
  • 目录7-9
  • 第1章 绪论9-15
  • 1.1 课题背景和研究意义9-12
  • 1.1.1 选题背景9-10
  • 1.1.2 研究意义10-11
  • 1.1.3 研究内容11-12
  • 1.2 国内外研究现状12-14
  • 1.2.1 多核多线程处理器研究现状12-13
  • 1.2.2 处理器资源动态重构研究现状13-14
  • 1.3 论文的结构安排14-15
  • 第2章 多核/多线程架构与动态重构技术15-27
  • 2.1 CMP 与 SMT 架构简介15-21
  • 2.1.1 CMP 架构处理器16-19
  • 2.1.2 SMT 架构处理器19-21
  • 2.2 CMT 架构介绍21-24
  • 2.3 处理器资源分配研究24-26
  • 2.4 本章小结26-27
  • 第3章 基于 CMT 的 ROB 动态分配算法27-41
  • 3.1 资源使用效率分析27-30
  • 3.1.1 RUM-CMT 基本思想27-28
  • 3.1.2 资源动态框架28-30
  • 3.2 RUM 算法详细描述30-32
  • 3.3 实验平台简介32-36
  • 3.3.1 Simics 模拟器介绍32-33
  • 3.3.2 GEMS 简介33-34
  • 3.3.3 功耗估计34-35
  • 3.3.4 SPEC OMP 简介35-36
  • 3.4 评价方法36-37
  • 3.5 实验结果与分析37-40
  • 3.6 本章小结40-41
  • 第4章 面向低功耗的 ROB 分配算法41-51
  • 4.1 RUM_LP-CMT 算法框架41-43
  • 4.2 RUM_LP 算法详细描述43
  • 4.3 评价方法43-44
  • 4.4 实验结果与分析44-50
  • 4.5 本章小结50-51
  • 结论51-53
  • 工作总结51-52
  • 进一步工作52-53
  • 参考文献53-57
  • 攻读硕士学位期间所取得的成果57-59
  • 致谢59

【相似文献】

中国期刊全文数据库 前10条

1 Robert Cravotta;;可配置处理器应用日趋红火[J];电子设计技术;2003年11期

2 刘磊;邹候文;唐屹;;一种可编程安全处理器体系结构的研究与实现[J];广州大学学报(自然科学版);2006年04期

3 张铮;赵荣彩;颜峻;邰铭;陈科;;网络处理器体系结构和应用综述[J];信息工程大学学报;2006年04期

4 张怡,孙志刚;基于IPSec的下一代高性能安全处理器的体系结构[J];国防科技大学学报;2003年02期

5 岳虹;戴葵;王志英;;一种面向数字信号处理的嵌入式处理器体系结构设计[J];计算机工程与科学;2006年10期

6 许珊琳;;适合嵌入应用的嵌入式处理器[J];中国集成电路;2009年02期

7 张磊;王颖;陈云霁;徐志伟;张立新;;可重塑处理器:用户可定义的加速器中处理器架构[J];网络新媒体技术;2012年06期

8 Robert Cravotta;;一个处理器能兼顾控制与信号处理吗?[J];电子设计技术;2002年07期

9 朱丹;李暾;郭阳;李思昆;;微处理器体系结构级测试程序自动生成技术[J];软件学报;2005年12期

10 ;高性能处理器云集市场[J];每周电脑报;1997年15期

中国重要会议论文全文数据库 前3条

1 宋绯;刘晓宁;;DSP/MCU结构的新型处理器[A];第九届全国青年通信学术会议论文集[C];2004年

2 赵秋平;杨灿群;王锋;;LBM算法在Cell处理器上的实现和优化[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

3 周巍;孙冰;战立明;吕建华;王国仁;于戈;;基于DOM模型的XML查询处理器的设计与实现[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

中国重要报纸全文数据库 前10条

1 ;处理器上演多核大戏[N];计算机世界;2005年

2 心元;PC“心脏”的搏击[N];计算机世界;2004年

3 清华大学微处理器与SoC技 术研究中心 王海霞 汪东升;颠覆传统理念[N];计算机世界;2005年

4 清华大学微处理器与SoC技术研究 中心 汪东升 王海霞 张悠慧 李兆麟;CMP 开启处理器效能时代[N];计算机世界;2005年

5 江苏 netfan;体现速度与性能[N];电脑报;2004年

6 四川 王毅;变革进行时[N];电脑报;2004年

7 清华大学微处理器与SoC技术研究中心 汪东升;多核技术天地广阔[N];计算机世界;2006年

8 本报记者 李献 王皓;2002年服务器四大景观[N];计算机世界;2003年

9 ;MontaVista Linux 2.1跨平台[N];中国计算机报;2002年

10 ;CPU技术进步牛气冲天[N];计算机世界;2004年

中国博士学位论文全文数据库 前10条

1 徐光;分片式流处理器体系结构[D];中国科学技术大学;2010年

2 魏继增;可配置可扩展处理器关键问题研究[D];天津大学;2010年

3 霍文捷;嵌入式处理器安全运行机制的研究与设计[D];华中科技大学;2010年

4 从明;类数据流驱动的分片式处理器体系结构[D];中国科学技术大学;2009年

5 李勇;异步数据触发微处理器体系结构关键技术研究与实现[D];国防科学技术大学;2007年

6 任永青;逻辑核动态可重构的众核处理器体系结构[D];中国科学技术大学;2010年

7 黎铁军;嵌入式流媒体处理器体系结构技术研究[D];国防科学技术大学;2005年

8 黄海林;高可靠处理器体系结构研究[D];中国科学院研究生院(计算技术研究所);2006年

9 刘光辉;高效处理器容错技术研究与实现[D];国防科学技术大学;2013年

10 温璞;面向科学计算的PIM体系结构技术研究[D];国防科学技术大学;2007年

中国硕士学位论文全文数据库 前10条

1 曾斌;分片式处理器体系结构上的超块优化技术[D];中国科学技术大学;2009年

2 黄冕;X处理器存储一致性模型的研究与实现[D];国防科学技术大学;2008年

3 赵灿明;分片式处理器上激进执行模型分析[D];中国科学技术大学;2009年

4 刘晋汾;处理器描述语言的研究与应用[D];解放军信息工程大学;2011年

5 邸志雄;多核包处理器数据控制总线技术研究[D];西安电子科技大学;2010年

6 方红霞;基于指令的处理器时延测试产生方法[D];中国科学院研究生院(计算技术研究所);2005年

7 刘子扬;基于虚拟计算群的众核处理器动态在线任务调度算法研究[D];上海交通大学;2013年

8 董亚卓;循环阵列处理器体系结构的关键技术研究与实现[D];国防科学技术大学;2004年

9 黎宝峰;嵌入式DSP处理器的设计与验证[D];湖南大学;2003年

10 梁志勇;X处理器流指令发射机制研究及硬件实现[D];国防科学技术大学;2006年


  本文关键词:面向低功耗的多核多线程架构研究,由笔耕文化传播整理发布。



本文编号:369135

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/369135.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户580de***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com