一款高性能64位DSP中SIMD结构FMAC的设计与验证
发布时间:2017-11-19 01:02
本文关键词:一款高性能64位DSP中SIMD结构FMAC的设计与验证
更多相关文章: 通路分离结构 浮点融合乘加部件 通路复用 复数乘法 黄金模型 功能验证
【摘要】:X-DSP是我校自主研制的面向密集型数据计算的64位高性能通用DSP,采用11发射的超长指令字结构。该DSP内核设有浮点乘加(FMAC)部件,X-DSP的FMAC部件功能强大,其性能指标直接决定X-DSP的峰值性能,如何设计出功耗低、面积小、性能高的FMAC部件是一项极具挑战性的工作。本文围绕FMAC的优化设计和功能验证展开,主要工作和创新点如下:(1)根据算法和性能需求设计了通路分离FMAC部件总体结构该部件能够支持64位双精度浮点操作和32位SIMD(Single Instruction Multiple Data)单精度浮点操作,实现了乘法、加法、融合乘加、点积和复数乘法共12条指令。在设计过程中根据功能需求提出三种FMAC结构(非融合乘加FMAC结构、非分离融合乘加FMAC结构、通路分离FMAC结构),并进行了全面的性能和代价分析,其中非融合乘加FMAC结构在实现双精度乘加操作时延时较大;非分离融合乘加FMAC结构采用单、双精度数据通路复用设计,导致点积和复数乘法的算法实现复杂、计算延时长、硬件开销大。本文针对以上两种结构的优缺点设计了通路分离FMAC总体结构。(2)通路分离结构FMAC部件的优化设计与指令的数据通路复用设计首先,提出单、双精度通路分离的FMAC部件结构,优化关键路径延时和减小面积开销,其中双精度通路采用融合乘加(A*B+C)策略,将对阶移位后的操作数C作为部分积融合到尾数乘法部分积压缩阵列中,缩短双精度乘加尾数计算延时;单精度通路通过简化点积和复数乘法操作的算法实现复杂度以减小面积和优化时序。其次,优化乘法器结构,采用4个32*32乘法器来实现双精度和SIMD单精度乘法、融合乘加、点积和复数乘法中的尾数乘法,复用单、双精度通路实现复数乘法中的实部运算和虚部运算。最后,在通路分离FMAC结构基础上,复用尾数对阶、尾数加法和规格化等逻辑,实现了5周期双精度浮点加法和SIMD单精度浮点加法。(3)FMAC部件的功能验证根据FMAC实现的12条指令,为每条指令编写了拥有4种rounding-mode(舍入模式)的C语言仿硬件执行的Golden Model,用于功能验证中的结果比对以及作为形式化验证中的参考模型。通过模拟验证和形式化验证等方法,从模块级和系统级对FMAC进行了功能验证,最后对FMAC部件进行了覆盖率分析。
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP332.2
,
本文编号:1201742
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1201742.html