局部同质的异质DSP处理器设计研究
发布时间:2020-05-20 01:33
【摘要】:数字信号处理技术的飞速发展及其应用领域的不断细分,使得当前数字信号处理器面临着应用算法多样化和专门化的严重挑战,如何方便快捷地设计出适用的数字信号处理器成为当前数字信号处理系统设计的核心问题之一。 本文作者承担了浙江大学16位数据线宽DSP处理器—MD16软硬件系统设计项目,以此为基础,本文针对处理器体系结构设计、若干关键实现设计、核心功能部件MAC设计以及软硬件协同仿真验证等展开论证,力求建立一套面向中低端数字信号处理系统应用的DSP处理器设计、仿真、验证通用方法,以方便高效地设计出能够满足特定应用算法需求的DSP处理器,从而加速从设计到产品转化周期。 本文的主要的内容和创新如下: 提出了基于局部同质的异质DSP体系结构设计思想;在指令结构上,采用等差扩展操作类型码方法来平衡指令出现的概率分布和增强指令功能两方面要求,建立操作数码和寄存器结构的关系模型,将寄存器结构设计转变为特定有限域GF(2~[log_2~n])上的操作数编码最优问题,从而得出本文指令设计方案和类RISC局部同质而总体异质的寄存器组织形式;采用类RISC扩展LOAD/STORE结构和二维寻址机制来进行高效的存储器访问,对于寻址单元设计,提出了一种基于虚拟上下边界的任意长度循环寻址方法来解决多个不等长循环数组的连续存放问题,论证了一种不产生基地址的统一地址产生电路优化方案;对于提高代码功能密度方面,利用运算功能和存储器访问功能的正交性以实现两方面操作的并行化,并从存储系统层次保证其可行性; 根据局部同质的异质DSP体系结构模型,指出MD16具体实现要求和流水线划分原则,通过对比不同的划分方法,合理安排流水线中指令的执行动作,最终确定以降低数据、控制相关性为导向并满足系统频率和时序要求的MD16可扩展执行(EX)级的类RISC四级流水结构,使得类RISC指令、复杂DSP指令、多操作指令通过统一的流水线结构安排融合在一起。 提出了一种构建多模式算法最小并集的MAC通用结构思想与一种划分MAC通用结构以适应多流水级DSP处理器设计的通用MAC设计方法;对于BOOTH编码和部分积产生,提出了直接建立被乘数与部分积的多路选择映射关系的BOOTH编码和部分积联合产生方法;对于最优Wallace树型加法实现,提出了全加器和4-2 compressor电路实现 Wallace树加法所需的关键加法路径级数公式以指导实现选择;对于无偏舍入处理,,提出了在Wallace树处理舍入问题的舍入运算前置方法;提出了以时延为导向的MAC各部分单元组合与流水线匹配具体方法。本文MAC设计思想和方法已经申请发明专利。 对MD16协同验证平台设计进行了研究;通过基于C语言PC机子平台、基于HDL语言虚拟机子平台和基于FPGA的硬子平台分别、协同仿真验证,保证了MD16处理器的正确性和完备性。 MD16处理器已完成流片,芯片采用SMIC 0.18μm 6层CMOS工艺加工,在核心电压1.8V情况下,其可工作在0-162MHz,此时功耗为1.1mW/MHz。
【图文】:
对于集成了信号处理单元、接口单元、模拟单元以及专用硬件调试单元等多种结构在一起的复杂片上系统(soC)设计,其设计方法与设计工具越来越受到关注[36一’】。soc系统不仅需要软件和硬件的协同设计,还需要一个强大的系统设计平台给予支持142],如图1一2所示。在图1一2所示的一个SOC系统开发平台中,需要进行体系结构、微结构的划分和设计,进行功能的确定和系统应用的开发,对各个设计层次和功能进行匹配和比较,最终达到一致。这一匹配、比较过程是在系统设计过程中分阶段、分步骤的进行设计、验证、仿真、综合、测试的过程;因此建立一个通用的软硬件仿真验证的平台非常必要。
访问存储单元的数据地址。故TlC54x等众多DSP处理器将地址计算流水级安排在存储单元访问级之前进行,而运算级安排在两者之后进行。RICS和DSP处理器流水结构的不同安排可如图3一1所示:RISCFFFetchhhTlC54xPPPer一Feot卜卜FetChhh狡与协E‘“u‘,。n图3一1RSIC与DSP处理器流水结构安排比较图3一Zt匕较了典型Rlse结构的MxPsR300o处理器I,7一,“l和DSP处理器TxTMs32oe54x流水线结构。从图中可以看出,两种处理器设计对于地址计算级、存储单元访问级以及指令执行级的安排各有不同。TMS32OC54x流水级结构PF/F指令译码和地址计算访问存、、,、、、龟..、、、、、执行与储器一、、写回、-、‘-、龟-‘‘.龟、、、,、MIPSR3000流水级结构ALU1DCaeheITLBDA!DTLB图3一2MIPSR30OO与TMS32OC54x流水级结构比较MD16与MIPSR3000和TlC54x相比有如下异同点:》与MPISR300O相比,MD16指令系统中所有的运算指令均为基于寄存器的操作
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP332
本文编号:2671805
【图文】:
对于集成了信号处理单元、接口单元、模拟单元以及专用硬件调试单元等多种结构在一起的复杂片上系统(soC)设计,其设计方法与设计工具越来越受到关注[36一’】。soc系统不仅需要软件和硬件的协同设计,还需要一个强大的系统设计平台给予支持142],如图1一2所示。在图1一2所示的一个SOC系统开发平台中,需要进行体系结构、微结构的划分和设计,进行功能的确定和系统应用的开发,对各个设计层次和功能进行匹配和比较,最终达到一致。这一匹配、比较过程是在系统设计过程中分阶段、分步骤的进行设计、验证、仿真、综合、测试的过程;因此建立一个通用的软硬件仿真验证的平台非常必要。
访问存储单元的数据地址。故TlC54x等众多DSP处理器将地址计算流水级安排在存储单元访问级之前进行,而运算级安排在两者之后进行。RICS和DSP处理器流水结构的不同安排可如图3一1所示:RISCFFFetchhhTlC54xPPPer一Feot卜卜FetChhh狡与协E‘“u‘,。n图3一1RSIC与DSP处理器流水结构安排比较图3一Zt匕较了典型Rlse结构的MxPsR300o处理器I,7一,“l和DSP处理器TxTMs32oe54x流水线结构。从图中可以看出,两种处理器设计对于地址计算级、存储单元访问级以及指令执行级的安排各有不同。TMS32OC54x流水级结构PF/F指令译码和地址计算访问存、、,、、、龟..、、、、、执行与储器一、、写回、-、‘-、龟-‘‘.龟、、、,、MIPSR3000流水级结构ALU1DCaeheITLBDA!DTLB图3一2MIPSR30OO与TMS32OC54x流水级结构比较MD16与MIPSR3000和TlC54x相比有如下异同点:》与MPISR300O相比,MD16指令系统中所有的运算指令均为基于寄存器的操作
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP332
【引证文献】
相关硕士学位论文 前4条
1 张炜;媒体数字信号处理器的结构和应用系统设计研究[D];浙江大学;2006年
2 范佑;媒体数字信号处理器的增强设计及应用研究[D];浙江大学;2007年
3 冯美;控制处理芯片的指令集控制与寄存器管理技术设计研究[D];电子科技大学;2007年
4 马骥;媒体数字信号处理器IP核优化设计研究[D];浙江大学;2007年
本文编号:2671805
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2671805.html