高性能低功耗多核处理器研究
发布时间:2020-07-22 03:52
【摘要】:通信与多媒体等领域对电子产品性能、功耗、设计周期、灵活性的特定要求,决定了专用集成电路或者基于单个处理器的片上系统都不是很好的解决方案。而多核处理器则依靠其优秀的性能、通用性、灵活性成为了一个理想的选择,所以它也是当前学术界和产业界的研究热点。虽然已经有了较多比较优秀的多核处理器研究成果,不过由于多核处理器系统的复杂性和应用环境的多样性,目前还没有出现一个最优的或者统一的体系架构,仍然有许多内容值得研究和探索。 本论文旨在针对通信和多媒体领域应用,设计一款高性能、低功耗的多核处理器。在分析和借鉴已有的一些较优秀的多核处理器设计的基础上,论文的研究工作主要是对多核处理器的计算、通信和存储这三个核心部分进行探索和创新。以下是本论文的主要工作内容: (1) SIMD-RISC处理器 本论文以MIPS324KE作为设计参考,实现了一款能够部分兼容MIPS32指令集并且支持单指令多数据(SIMD)结构的单核SIMD-RISC处理器。在通过利用数据并行性来提升处理器性能的同时也大大提高了其能量效率,实现了高性能和低功耗这两个设计目标。 (2)可配置寄存器文件 本论文对传统的寄存器文件进行了改革,采用了以寄存器组为单位的可配置寄存器文件。在无需改变指令的宽度和编码方式的前提下,允许程序根据需要灵活配置和使用64个通用寄存器,从而大大减少处理器对外部存储器的访问次数。这样既可以提高处理器的运算效率还能避免因暂存数据而引起的功耗。 (3)簇状结构 本论文提出了一种以簇状结构为基本单位的多核处理器阵列。在系统级架构层面,簇状结构使得多核处理器具有几何对称和易扩展的特性。簇状结构本身则实现了对存储器资源的合理分配以及处理器核间的高效同步。 (4)混合通信方式 本文提出的多核处理器实现了基于片上网络的数据通信(message-passing)和基于共享数据存储器(shared-memory)的簇内通信的混合通信方式。基于片上网络的通信采用数据包的形式进行数据传递,具有很好的灵活性,是一种全局的通信方式:基于共享存储器的簇内通信以存储器访问带宽为代价可有效减轻片上网络的通信负荷,是一种高效的局部通信方式。 (5)基于65nm工艺的芯片实现 本论文在完成了多核处理器硬件RTL级设计和验证后,进一步完成了芯片实现的工作:多核处理器采用了TSMC65纳米低功耗工艺库,在芯片中实现了拥有两个簇状结构即16个处理器阵列,芯片的面积为2935.6*3100um,共有124个管脚。根据IC Compiler的报告分析,在典型工艺角下芯片的最高时钟频率可达到600MHz,每个处理器节点的功耗约为80mw。
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP332
【图文】:
图1一2处理器性能随时间的发展关系(引自〔3J)对于如图卜飞这样的嵌入式系统而言,由于采用的是主从结构,所以位于核心地位的嵌入式处理器往往有可能成为系统的瓶颈所在。虽然嵌入式处理器的性能在不断提升,但是近年来随着半导体制造进入深亚微米工艺后,其性能的提升速度已大大降低,如图卜2所示。面对用户对产品性能要求永无止境的增长,仅仅挖掘单个处理器的性能潜力显然己不足以提升整个嵌入式系统的系能并满足用户的要求。于是在单核处理器体系结构继续演进的同时,多核处理器应运而生。如图卜3所示,是一个基于共享总线的多核处理器片上系统在盖个处理器性能趁近极限的情沉下,多核嵌入式系统能够通过挖掘任务级并行往从而有效提升系统整体的性能:但是这样的多核处理器系统能够集成的处理器数据非常有限,这是因为共享总线的带宽是一定的,各个处理器需要来竞争私分享这一资源:过多增加系统中处理器的数目,只会导致大部分数据因为无法获得总线控制权而处于
AMBA总线:AHB+APBll图1一l基于单核处理器的典型片上系统10,0001,0001002弓%/丫e盯
本文编号:2765290
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP332
【图文】:
图1一2处理器性能随时间的发展关系(引自〔3J)对于如图卜飞这样的嵌入式系统而言,由于采用的是主从结构,所以位于核心地位的嵌入式处理器往往有可能成为系统的瓶颈所在。虽然嵌入式处理器的性能在不断提升,但是近年来随着半导体制造进入深亚微米工艺后,其性能的提升速度已大大降低,如图卜2所示。面对用户对产品性能要求永无止境的增长,仅仅挖掘单个处理器的性能潜力显然己不足以提升整个嵌入式系统的系能并满足用户的要求。于是在单核处理器体系结构继续演进的同时,多核处理器应运而生。如图卜3所示,是一个基于共享总线的多核处理器片上系统在盖个处理器性能趁近极限的情沉下,多核嵌入式系统能够通过挖掘任务级并行往从而有效提升系统整体的性能:但是这样的多核处理器系统能够集成的处理器数据非常有限,这是因为共享总线的带宽是一定的,各个处理器需要来竞争私分享这一资源:过多增加系统中处理器的数目,只会导致大部分数据因为无法获得总线控制权而处于
AMBA总线:AHB+APBll图1一l基于单核处理器的典型片上系统10,0001,0001002弓%/丫e盯
本文编号:2765290
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2765290.html