基于SimpleScalar的性能和功耗分析多核模拟器
发布时间:2020-08-10 08:32
【摘要】: 为了应对日益复杂的应用,处理器芯片的设计现在已经基本达成一个共识:将来一个芯片内会集成多个甚至成百上千个处理器。尽管现在已经有多核处理器的产品,但是从体系结构到软件开发方面还存在很多问题。而在众多问题中,低功耗和热优化(Thermal Management)设计已经成为微处理研究中的核心问题,片上多处理器(CMP)的多核结构决定了其相关的功耗研究是一个至关重要的课题。低功耗设计是一个多层次问题,需要同时在操作系统级,算法级,结构级,电路级等多个层次上进行研究,每个层次的低功耗设计方法的效果不同,抽象层次越高,功耗和温度降低的效果越明显。 想要对功耗进行深入的研究,对其特性在软件上进行模拟是一个很好的切入点。本文基于单核处理器模拟器SimpleScalar及其上的功耗模型Wattch,实现了一个能进行详细的性能和功耗分析的同构多核模拟器。 我们针对功耗模型计算量比较大这个问题进行了有趣的尝试,最后提出一种解决方案,可以根据不同的需求在模拟器速度和具体程度上进行折中。 全部程序在Linux上实现,由于使用了SystemC作为处理器核的外壳,因此改变处理器数目变得很容易。我们在这个平台上进行了大量有效的测试,比较功耗模型的效率。我们还把JPEG解压程序进行任务划分移植到双核系统上去。 实验证明,本文设计的有功耗和性能分析的多核模拟器是一个良好的研究平台,可以用于体系结构,应用程序并行化等研究。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP337
【图文】:
服务器群为代表的计算破功耗限制已经逐步成日益复杂的应用,处理内会集成多个甚至成百趋势下要突破功耗限制造成功耗增加以外,我能的深层次因素。从 9进工艺更是达到了 45流同样的数量级。显然硅基芯片工艺中漏电流热点,该处的漏电流也管理来控制这种显现,核处理器运行时的各个其他部件,是该处理器
多核处理器的发展现状根据芯片上集成的多个微处理器核心是否相同,CMP可分为同构CMP和P。同构CMP大多数由通用的处理器组成,多个处理器执行相同或者类似的任构CMP除含有通用处理器作为控制、通用计算之外,大多集成DSP、ASIC理器、VLIW处理器等针对特定的应用提高计算的性能。目前IBM,AMD,INTEL,SUN,HP,TI等公司已经相继推出了商业的CMIBM的POWER4[7]芯片是业界第一个正式发布的双内核处理器,其频率Hz。每个内核包含独立的64KB L1指令缓存、32KB L1数据缓存,两个内核512KB L2高速缓存区块。Power4的设计充分考虑了可扩展性,多个Power4以很容易地组成一个对称多处理器系统(SMP)。Power5[8]于2004年4月发系结构上,Power5相对于Power4最大的改进是引入了并发多线程(SMT)。
AMD在多核处理器的研发中显示出了相当的前瞻性,早在设计单核Opteron[18处理器时就已经考虑到多核的扩展。2005年4月,AMD在服务器市场推出了双内核Opteron系列处理器[9],它包含两个Athlon 64内核,每个内核都具有独立的L1和L2缓存。由于采用了集成的内存控制器和HyperTransport总线技术,虽然AMD的多核架构采用和Intel一样的独立的二级缓存,却能够保证访存低延时和缓存的一致性。在异构多核处理器方面,ARM+DSP结构受到了业界的广泛关注,产品以TI的OMAP最具代表性。OMAP(Open Multimedia Applications Platform 开放式多媒体应用平台)[24]是TI公司针对移动通讯以及多媒体嵌入应用系统开发的一套应用处理器架构体系。它采用一种独特的双核结构,把高性能低功耗的DSP核与控制性能强的ARM微处理器结合起来,成为一颗高度整合性SoC。由于OMAP先进独特的结构,其芯片运算处理能力强、功耗低,在移动通信和多媒体信号处理方面具有明显优势。此外,OMAP的开放式软件架构可保持双内核硬件对用户的透明度,以便于编程并集成到多功能产品中。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP337
【图文】:
服务器群为代表的计算破功耗限制已经逐步成日益复杂的应用,处理内会集成多个甚至成百趋势下要突破功耗限制造成功耗增加以外,我能的深层次因素。从 9进工艺更是达到了 45流同样的数量级。显然硅基芯片工艺中漏电流热点,该处的漏电流也管理来控制这种显现,核处理器运行时的各个其他部件,是该处理器
多核处理器的发展现状根据芯片上集成的多个微处理器核心是否相同,CMP可分为同构CMP和P。同构CMP大多数由通用的处理器组成,多个处理器执行相同或者类似的任构CMP除含有通用处理器作为控制、通用计算之外,大多集成DSP、ASIC理器、VLIW处理器等针对特定的应用提高计算的性能。目前IBM,AMD,INTEL,SUN,HP,TI等公司已经相继推出了商业的CMIBM的POWER4[7]芯片是业界第一个正式发布的双内核处理器,其频率Hz。每个内核包含独立的64KB L1指令缓存、32KB L1数据缓存,两个内核512KB L2高速缓存区块。Power4的设计充分考虑了可扩展性,多个Power4以很容易地组成一个对称多处理器系统(SMP)。Power5[8]于2004年4月发系结构上,Power5相对于Power4最大的改进是引入了并发多线程(SMT)。
AMD在多核处理器的研发中显示出了相当的前瞻性,早在设计单核Opteron[18处理器时就已经考虑到多核的扩展。2005年4月,AMD在服务器市场推出了双内核Opteron系列处理器[9],它包含两个Athlon 64内核,每个内核都具有独立的L1和L2缓存。由于采用了集成的内存控制器和HyperTransport总线技术,虽然AMD的多核架构采用和Intel一样的独立的二级缓存,却能够保证访存低延时和缓存的一致性。在异构多核处理器方面,ARM+DSP结构受到了业界的广泛关注,产品以TI的OMAP最具代表性。OMAP(Open Multimedia Applications Platform 开放式多媒体应用平台)[24]是TI公司针对移动通讯以及多媒体嵌入应用系统开发的一套应用处理器架构体系。它采用一种独特的双核结构,把高性能低功耗的DSP核与控制性能强的ARM微处理器结合起来,成为一颗高度整合性SoC。由于OMAP先进独特的结构,其芯片运算处理能力强、功耗低,在移动通信和多媒体信号处理方面具有明显优势。此外,OMAP的开放式软件架构可保持双内核硬件对用户的透明度,以便于编程并集成到多功能产品中。
【相似文献】
相关期刊论文 前10条
1 高世明;孟令军;李宝刚;贾至江;;基于NiosII多核处理器的JPEG解码的设计与实现[J];电视技术;2011年05期
2 计卫星;王永辉;宋红;;一种面向M5的图形化并行模拟技术研究[J];微电子学与计算机;2010年08期
3 陈f
本文编号:2787835
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2787835.html