DSP-DX取指派发部件的设计优化与实现
本文选题:跨边界派发 + 混合指令 ; 参考:《国防科学技术大学》2013年硕士论文
【摘要】:DSP-DX CPU是一款支持定点和浮点运算的新一代DSP,采用支持8流出的VLIW结构。传统VLIW体系结构的DSP具有指令代码体积大,存取效率低的问题。为解决这些问题,DSP-DX CPU采用了16位/32位混合指令集和跨边界派发技术。这些技术的逻辑结构在取指部件的指令接收站(PR站)和派发部件的指令派发站(DP站)实现。由此增加了取指派发部件实现的复杂度和时延。在40nm工艺和SS的情况下需要对取指派发部件进行逻辑结构和时序优化以保证设计目标的实现。 按照DSP-DX CPU的设计要求,本文主要完成如下的工作 1.为压缩代码体积和提高执行效率,取指派发部件采用跨边界派发技术和16位/32位混合指令技术,对派发部件的结构进行设计和验证,特别对并行位ID和分支ID产生电路及指令派发控制位产生等电路进行了逻辑设计,提高了指令执行并行度并验证了其功能正确性。 2.用微体系结构优化的方法完成关键模块的时序优化,利用DC综合工具对取指派发部件进行综合优化,找出关键路径,确定各个模块的优化实现策略,调整了关键路径上的逻辑结构,优化结果表明消除了关键路径延时,达到总体设计目标要求。 3.采用手工半定制设计的方法完成了取指派发部件物理设计,并通过DRC和LVS检查,达到了比较好的时序优化效果。
[Abstract]:DSP-DX CPU is a new generation of DSP which supports fixed-point and floating-point operations.The traditional VLIW architecture of DSP has the problems of large size of instruction code and low access efficiency.To solve these problems, DSP-DX CPU uses 16-bit / 32-bit hybrid instruction set and cross-border distribution technology.The logical structure of these techniques is realized at the instruction receiving station (PR station) and the instruction dispatch station (DP station).Thus, the complexity and delay of the implementation of the fetch and dispatch components are increased.In the case of 40nm process and SS, it is necessary to optimize the logical structure and timing of the wire-out parts to ensure the realization of the design objectives.According to the design requirements of DSP-DX CPU, this paper mainly completes the following work1.In order to compress the size of code and improve the efficiency of execution, the distributed parts are designed and verified by using cross-boundary dispatch technology and 16-bit / 32-bit hybrid instruction technology.In particular, the parallel bit ID and branch ID generation circuits and the instruction dispatch control bit generation circuits are designed, which improves the parallelism of instruction execution and verifies the correctness of its function.2.The timing optimization of the key modules is accomplished by the method of microarchitecture optimization, and the key path is found out by using the DC synthesis tool to optimize the finger picking and distributing parts, and the optimal realization strategy of each module is determined.The logic structure of the critical path is adjusted and the optimization results show that the delay of the critical path is eliminated and the overall design goal is achieved.3.The manual semi-custom design method is used to complete the physical design of the finger picking and distributing parts, and through the DRC and LVS checks, a better timing optimization effect is achieved.
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP332.2
【共引文献】
相关期刊论文 前10条
1 石俊萍;;《计算机体系结构》教学设计与课件制作[J];电脑知识与技术;2014年08期
2 肖泽强;;动态分支预测技术分析与量化研究[J];信息技术;2011年03期
3 李浩;谢伦国;;片上多处理器末级Cache优化技术研究[J];计算机研究与发展;2012年S1期
4 余立民;罗明;王敬平;薛主坤;杨名时;王欣;;基于XPE的嵌入式移动集群设计与实现[J];计算机工程;2012年12期
5 童小念;何秉娇;舒万能;;“计算机系统结构”实践教学环节的研究与实施[J];计算机教育;2008年03期
6 姜晶菲;肖侬;王志英;陆洪毅;;“计算机体系结构”课程建设及改革思考[J];计算机教育;2009年18期
7 阮宏玮;李华;邢海峰;;论盲人摸象带给计算机教育的新思维[J];计算机教育;2009年23期
8 吴强;;在计算机专业教学中的并行性概念研究[J];科教文汇(上旬刊);2009年06期
9 谢伟;冯杰;;浅谈多层分布式应用体系结构[J];科技信息(科学教研);2008年14期
10 舒万能;童小念;何秉姣;;“计算机系统结构”实践教学体系研究[J];科技信息;2009年05期
相关会议论文 前2条
1 赵长林;辛阳;杨义先;;单生产者/单消费者(SPSC)环形缓冲队列算法的改进[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
2 欧阳海燕;徐长明;李少青;邢座程;盛叶鹏;;基于LBIST与JTAG结合的流水线测试结构设计[A];第十六届计算机工程与工艺年会暨第二届微处理器技术论坛论文集[C];2012年
相关博士学位论文 前6条
1 吕绍和;面向多包接收的无线网络调度研究[D];国防科学技术大学;2011年
2 侯f ;海量网络存储系统中的多级缓存技术研究[D];华南理工大学;2011年
3 罗迅;海量多级光集成存储中的虚拟镜像系统优化方法的研究[D];清华大学;2006年
4 温璞;面向科学计算的PIM体系结构技术研究[D];国防科学技术大学;2007年
5 陈微;基于动态二进制翻译的协同设计虚拟机关键技术研究[D];国防科学技术大学;2010年
6 王旭;锥束CT图像重建中离散希尔伯特变换的快速计算研究[D];哈尔滨工业大学;2013年
相关硕士学位论文 前10条
1 庄锦灿;Light Peak传输层及硬盘网卡驱动的设计与实现[D];北京邮电大学;2011年
2 吴长莉;基于MPI和OpenMP的三维FDTD并行算法的研究[D];华中科技大学;2009年
3 常艳蕊;基于浮点数的CORDIC算法的研究与设计[D];华中科技大学;2010年
4 杜溢墨;闪存存储系统中的RAID机制研究[D];国防科学技术大学;2010年
5 胡婷婷;抗内部存储单元失效的32位微处理器的研究与实现[D];华中科技大学;2011年
6 马霈;双控制器磁盘阵列数据同步通道中的高速传输技术研究[D];华中科技大学;2011年
7 陈晓丹;基于ADSP-TS201S的实时ISAR成像技术研究与实现[D];国防科学技术大学;2011年
8 石文强;多核Cache替换策略模型研究[D];国防科学技术大学;2011年
9 鲍先强;面向云环境的文件同步服务系统设计与实现[D];国防科学技术大学;2011年
10 徐金龙;基于动态翻译的CPU仿真技术研究[D];解放军信息工程大学;2011年
,本文编号:1742237
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1742237.html