32位高性能嵌入式向量微处理器关键技术的研究与实现
发布时间:2020-10-11 10:42
近年来,嵌入式微处理器正在被迅速地应用到人们日常生活的各个方面。随着半导体工艺技术的提高、体系结构技术的不断发展,以及应用需求的不断提高,对高性能嵌入式微处理器产品的需求量也越来越大。 提高嵌入式微处理器性能的一个途径就是将以前在高端微处理器中应用的技术下移到嵌入式微处理器中,使得成熟的技术可以被直接应用到嵌入式微处理器中,从而直接改善嵌入式微处理器的性能。 向量技术已经在许多高端的通用微处理器中得到应用,并在媒体信息处理等应用中取得了很好的效果。将向量技术应用在嵌入式微处理器,必然会提高嵌入式微处理器处理类似媒体信息等应用的能力,从而扩大嵌入式微处理的应用领域。 本文提出了一种基于标量向量混合执行模型的体系结构,并将之与标量执行模型、向量执行模型进行比较。通过Petri网模型分析与EDA工具的实验数据,证实标量向量混合执行模型适用于嵌入式微处理器的体系结构设计。 本文提出了基于ARM V4指令集体系结构扩展的银河TS-1指令集体系结构,在同一个指令集内同时支持标量机制和向量机制。 本文提出了一种基于二进制代码向量化的方法,可以有效地检测到二进制代码中单重循环的结构,并能够有效地对其可向量化的成份进行向量化。 本文提出并设计了银河TS-1 32位高性能嵌入式向量微处理器的体系结构。银河TS-1采用典型的RISC结构,六级流水线,具有独立的指令Cache和数据Cache。 基于标量向量混合执行模型,提出并设计了银河TS-1中向量的实现机制。支持向量基本运算操作,并能与标量执行机制完全融合。 另外,本文还研究了银河TS-1的低功耗设计技术,研究了银河TS-I对WISHBONE SoC接口的支持等设计技术。 最后,给出了银河TS-1的PPGA以及ASIC实现方案。银河TS-1已经在FPGA上通过了验证,在UMC 0.25μm工艺上的ASIC实现也即将完成。 总的来说,银河TS-1是一个高性能的嵌入式向量微处理器,能够兼容主流的嵌入式微处理器,支持向量处理,具有良好的接口,是一个具有自主知识产权的高性能嵌入式向量微处理器核。
【学位单位】:中国人民解放军国防科学技术大学
【学位级别】:博士
【学位年份】:2002
【中图分类】:TP332
【部分图文】:
互5.2基本指令处理通路和数据通路根据银河TS一1体系结构的特点,并且参照标准的DLX五级流水线:取指、译码、执行、访存和写回,我们设计了银河TS一1流水线核的指令流通路和数据通路。图5.2显示了银河TS一1流水线核的基本系统框图,从图5.2中可以看到指令处理的大致流程是:首先从指令数据总线上取到指令,进入译码器译码,根据译码的结果读寄存器文件和形成各种控制信号,读寄存器文件的一个结果知直接送到ALU的一个端口,另外的两个结果Rill、RS要通过布斯乘法器或桶式移位器后进入ALU的另一个端口,然后进行ALU操作。ALU执行的结果用来访存或者直接写入寄存器文件。图5.2银河TS一1流水线核总体框图银河TS一1的数据通路包括处理器中的执行单元,如算逻运算单元(ALU)、布斯乘法器、桶式移位器等和寄存器文件以及它们之间的连接通路。数据通路中的功能部件均是用verllog语言描述的可综合的RTL级设计。布斯乘法器是32位布斯乘法器,采用两位一乘。64位输出
Cache与指令cache的管理[66]。流水线核向存控发出存储器访问请求,存控根据请求,访问数据Cache或者指令Cache,必要的时候,将访问外部SRAM存储器,最后将访存的结果返回给流水线核。在Cache与流水线核之间采用简单的应答机制进行通信。图5.4给出了整个存储子系统的框图。第35页
图5.5存储器的读时序Cache与外部存储器之间的速度匹配是通过在有限状态机中设置相应的计数器实现的。存储器接口的模块图如图5.6所示。flWAIT一一--一一月卜亡缨图5.6存储器接口模块图与TS一1的接口如图5.7所示。图5.7与银河TS一1处理器核的接口图第37页
【引证文献】
本文编号:2836477
【学位单位】:中国人民解放军国防科学技术大学
【学位级别】:博士
【学位年份】:2002
【中图分类】:TP332
【部分图文】:
互5.2基本指令处理通路和数据通路根据银河TS一1体系结构的特点,并且参照标准的DLX五级流水线:取指、译码、执行、访存和写回,我们设计了银河TS一1流水线核的指令流通路和数据通路。图5.2显示了银河TS一1流水线核的基本系统框图,从图5.2中可以看到指令处理的大致流程是:首先从指令数据总线上取到指令,进入译码器译码,根据译码的结果读寄存器文件和形成各种控制信号,读寄存器文件的一个结果知直接送到ALU的一个端口,另外的两个结果Rill、RS要通过布斯乘法器或桶式移位器后进入ALU的另一个端口,然后进行ALU操作。ALU执行的结果用来访存或者直接写入寄存器文件。图5.2银河TS一1流水线核总体框图银河TS一1的数据通路包括处理器中的执行单元,如算逻运算单元(ALU)、布斯乘法器、桶式移位器等和寄存器文件以及它们之间的连接通路。数据通路中的功能部件均是用verllog语言描述的可综合的RTL级设计。布斯乘法器是32位布斯乘法器,采用两位一乘。64位输出
Cache与指令cache的管理[66]。流水线核向存控发出存储器访问请求,存控根据请求,访问数据Cache或者指令Cache,必要的时候,将访问外部SRAM存储器,最后将访存的结果返回给流水线核。在Cache与流水线核之间采用简单的应答机制进行通信。图5.4给出了整个存储子系统的框图。第35页
图5.5存储器的读时序Cache与外部存储器之间的速度匹配是通过在有限状态机中设置相应的计数器实现的。存储器接口的模块图如图5.6所示。flWAIT一一--一一月卜亡缨图5.6存储器接口模块图与TS一1的接口如图5.7所示。图5.7与银河TS一1处理器核的接口图第37页
【引证文献】
相关硕士学位论文 前4条
1 杜鹃;基于FPGA的高帧频CMOS相机数据传输系统设计[D];西安工业大学;2011年
2 吴庆银;基于嵌入式的安全计算机板卡的测试系统的研究[D];东北大学;2009年
3 戚凌杰;面向处理器定制的模拟器快速生成方法[D];浙江大学;2006年
4 李比翼;基于ARM的LCU测试系统的设计[D];中南大学;2007年
本文编号:2836477
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2836477.html