当前位置:主页 > 科技论文 > 计算机论文 >

高性能嵌入式RISC微处理器核设计研究

发布时间:2020-11-19 23:36
   芯片设计技术和深亚微米工艺的进步使得系统集成在一块芯片中实现成为可能,嵌入式系统设计进入片上系统芯片时代。本文作者参与了浙江大学信息与电子工程学系SoC RD小组承担的国家863超大规模集成电路设计重大项目和具有自主知识产权的媒体系统芯片MediaSoC3221A设计和研发工作。本文主要探讨MediaSoC3221A双核之一的嵌入式RISC处理器的设计研究,本文的主要内容和创新如下: RISC处理器面向的应用范围广泛,不同的应用的特点不一样,对处理器的构造要求也不一样。比如有些应用存在丰富的线程并行性,采用多线程或者多核构造的处理器比较合适;有些应用本身就是一个不可拆分的单线程应用,采用高性能的多发射处理器更为适合。基于此本文提出通过两个简单RISC3200处理器设计在微结构上双发射与双核融合的RISC3202处理器。这也就是说,RISC3202在指令构造上与RISC3200一致,但在微结构上可以根据应用的特点配置成双发射超标量处理器,或者两个独立的RISC3200处理器,这是一种RISC处理器微结构构造创新。 媒体应用是当今处理器设计的驱动源之一,它已经成为RISC处理器必须考虑的工作负载。但是传统的基于RISC构造的处理器在提出之初并不是针对这类应用设计和优化的,因而它在处理这类应用时效率不高,必须对其指令集进行面向媒体处理的扩展,以提升其媒体处理的性能。本文针对RISC3200处理器第一代媒体扩展指令集MDS-Ⅰ存在数据处理效率高、数据供应效率低的缺点,新提出用于数据供应的媒体扩展指令集MDS-Ⅱ,有效提升了RISC3200的媒体处理效率。 在进行微处理器的功能仿真验证时,一个关键问题就是如何高效高质量的开发各种各样的验证程序。高效是指能快速开发出各种不同验证目的的验证程序,高质量是指开发出的验证程序的针对性好,能快速覆盖处理器需要验证的功能。针对这个问题,本文提出基于RISC3200指令构造的伪随机自动程序生成方法。它的核心包括两个部分:指令生成模型和程序模板。指令生成模型保证生成的指令合法有效,程序模板保证生成的指令序列针对性好。采用该方法后将验证程序的开发转换为C下的模板程序的开发,极大的方便了RISC3200仿真验证过程中的验证程序生成。 在系统芯片设计中,如何快速优化嵌入式软件也是一个非常关键的问题。本文以实现基于RISC3200的MP3软件解码器为例,对这个问题展开研究。在此基础上,总结出嵌入式软件优化的普遍原则和方法,并实际应用到MP3的解码软件优化中,取得不错的优化效果。然后根据新设计的RISC3202处理器的微结构特点,提出将MP3解码软件拆分成两个线程并行执行,在RISC3202上取得1.78的性能加速比。
【学位单位】:浙江大学
【学位级别】:博士
【学位年份】:2006
【中图分类】:TP332
【部分图文】:

示意图,超标量,处理器,示意图


ache组织)的主存访问机制。它的微结构典型组成模块包括:指令取部件、指令译码部件、发射部件、多个执行部件、逻辑寄存器文件、重命名寄存器文件、分支预测部件、指令交付部件、指令数据高速缓存等。其典型流水过程如图1一5所示。图1一5超标量处理器指令流水示意图与传统的单发射RISC处理器相比,超标量处理的特点如下:在每个时钟周期可以发射多条指令,这也是传统的单发射RISC处理器称为Sacarl处理器,而多发射的RlsC处理器称为s叩esraclar处理器的原因。每个时钟周期实际发射到执行部件的指令条数由硬件动态决定,最低为0,最高为处理器的最大发射宽度。超标量处理器的编程模型仍然是串行编程模型,因而它必须保证程序的串行完成顺序。因此,当代超标量处理器的指令执行一般分为三个阶段:指令发射

部件,流水线,线程


对于JBU部件,由于双发射模式只需要一个CP,因而一个JBU部件就足够。同时由于BJU部件功能相对简单,可以很容易的通过功能扩展使它能同时支持两种工作模式的PC地址产生的需要。因此本文采用了图2一6所示的JBU合并方案。另外由于RISc3202微结构中实际存在两个BJU部件,因此另一个BJU可以作为以后在双发射模式下实现硬件线程切换的其它线程的CP产生部件。图2一6CP产生部件合并方案PCU部件的合并相比BJU部件的合并复杂的多。这是因为它是微处理器流水线的核心部件,负责整个流水线的控制,微小的改动都需经过复杂的功能验证过程。在PCU的合并过程中,本文考虑过以下两种方案,如图2一7所示。(a)(b)图2一7流水线控制部件合并方案

流水线控制,部件


对于JBU部件,由于双发射模式只需要一个CP,因而一个JBU部件就足够。同时由于BJU部件功能相对简单,可以很容易的通过功能扩展使它能同时支持两种工作模式的PC地址产生的需要。因此本文采用了图2一6所示的JBU合并方案。另外由于RISc3202微结构中实际存在两个BJU部件,因此另一个BJU可以作为以后在双发射模式下实现硬件线程切换的其它线程的CP产生部件。图2一6CP产生部件合并方案PCU部件的合并相比BJU部件的合并复杂的多。这是因为它是微处理器流水线的核心部件,负责整个流水线的控制,微小的改动都需经过复杂的功能验证过程。在PCU的合并过程中,本文考虑过以下两种方案,如图2一7所示。(a)(b)图2一7流水线控制部件合并方案
【引证文献】

相关博士学位论文 前2条

1 蔡卫光;媒体数字信号处理器IP核微结构优化研究[D];浙江大学;2011年

2 陈科明;媒体多处理器系统芯片的设计研究[D];浙江大学;2007年


相关硕士学位论文 前3条

1 肖瑞瑾;多核处理器层次化存储体系研究[D];复旦大学;2012年

2 王海龙;基于ZSP400的MP3解码程序优化技术的研究[D];西安电子科技大学;2010年

3 赵彦尚;网络处理器微引擎的设计、验证与实现[D];西安电子科技大学;2013年



本文编号:2890597

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2890597.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2e7c1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com