当前位置:主页 > 科技论文 > 计算机论文 >

浮点单元超越函数的硬件实现及其优化

发布时间:2020-05-11 16:21
【摘要】:结合西北工业大学航空微电子中心所承担的某国家项目,作者参加了“龙腾”C2微处理器的设计与实现,主要负责浮点处理单元的结构设计和浮点超越函数的设计与实现。 “龙腾”C2微处理器与Intel 80486DX4指令系统兼容,支持IEEE754标准的单精度、双精度和扩展精度的浮点基本函数和超越函数的运算。 论文的主要工作如下: 1.在分析浮点指令的基础上,根据指令的特点和功能对浮点处理单元进行模块化分。 2.分析浮点超越函数的各种实现算法,并重点讨论了HP CORDIC算法及其流程,设计了超越函数实现的总体结构。 3.完成超越函数实现的数据路径设计,主要包括加法器、移位器、常数ROM和旋转控制逻辑,同时针对“龙腾”C2微处理器的性能要求对各个部件进行优化设计。 4.完成了超越函数实现的控制路径设计,主要包括控制路径的整体结构设计、每条超越函数指令的控制过程及状态转换、使用比较频繁的宏操作的控制过程和浮点异常的检测过程。 5.完成了浮点超越函数的验证和逻辑综合,主要验证内容包括单模块的验证、模块联合验证和系统验证。 通过验证和逻辑综合的结果表明,,浮点超越函数的运算精度和速度均满足“龙腾”C2微处理器的设计要求,主频达到143MHz。其后端设计由Cadence公司协助完成。
【图文】:

体系结构图,体系结构,单元,浮点处理单元


指令和 HPCORDIC算法对浮点单元进行了模块的划分。2.1“龙腾”CZ微处理器结构图2一1是“龙腾”CZ微处理器的体系结构图。从图上可以看到,包括一个总线接口单元 BIU(BusInterfaceUnit),一个时钟和复位控制单元 CRU(clockResetUnit),一个存储管理单元MMU(Memo砂ManagementU址t),一个数据和指令混合的CACHE单元 UCu(UnifiedCacheUait),一个整数处理单元IEU(Integer ExeeutionUnit),一个指令译码器 IDU(InstructionDeeoderUnit),一个浮点处理单元FpU(Floating一 pointUnit)

数据路径,双通路,路径,硬件资源


同样存在硬件资源浪费的问题。根据前面三通路和双通路结构的分析,知道这两种结构在不同程度上都存在着硬件资源浪费的情况。综合考虑,将双通路结构减少一条通路,使得成为单通路结构,如图3一3所示。图3一3单通路结构通过前面的分析可知,使用单通路结构实现 HPCORDIC算法不会存在硬件资源的空闲。虽然和双通路结构比较,运算速度会有所降低,但是“龙腾”CZ微处理器的主频要求是133MHz,使用单通路结构可以满足这个要求,同时还节省了面积,减少了硬件资源的浪费。图3一4是采用单通路结构实现的数据路径图。从图上看到,浮点超越函数实现的数据路径主要分成了三大部分,一是指数路径;二是尾数路径:三是符号路径。尾数路径主要的部件是加法器、移位器和常数ROM;指数路径主要的部件是加法器:符号路径主要的部件是CORDIC的旋转控制逻辑 Cordicindex;每条路径上
【学位授予单位】:西北工业大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP332.3

【引证文献】

相关硕士学位论文 前1条

1 王松;基于FPGA的浮点协处理器IP核设计[D];南京航空航天大学;2010年



本文编号:2658737

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2658737.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户843b9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com