当前位置:主页 > 科技论文 > 计算机论文 >

浮点运算加速器的设计研究

发布时间:2018-01-15 06:28

  本文关键词:浮点运算加速器的设计研究 出处:《浙江大学》2013年硕士论文 论文类型:学位论文


  更多相关文章: 浮点数运算器 融合乘加 乘累加 单周期累加算法 SIMD 操作数隔离 门控时钟


【摘要】:信息社会的发展使得科学研究、工业生产、人工智能以及3D游戏等应用都对浮点运算性能提出了更高的要求。因此低延迟高吞吐的浮点数运算单元是各类处理器设计中的关键部件。 在研究了传统的浮点加法器,浮点乘法器以及浮点融合乘加器的架构与实现方法后,本文基于一种单周期累加算法,改进了浮点运算单元的经典结构,在流水线中添加一条累加环路,通过进位保留算法使最终求和与规格化模块后置,实现了可在一个周期内完成浮点加法运算的累加模块,大幅提高了运算单元处理向量点乘时的效率,达到每周期一次浮点乘加。同时为了满足更多场合的需求,采用资源复用的设计支持SIMD运算,使其兼容双精度浮点数、两组单精度浮点数,32位有符号数以及两组16位有符号数,可执行加法,乘法,融合乘加和连续乘累加四种操作,并对乘法器、前导零检测等模块做了优化,以降低延迟与面积。最后针对该结构的数据流特性,采取了操作数隔离与门控时钟的低功耗技术。 本文采用SystemVerilog语言搭建验证平台,生成带约束的随机测试向量并自动检验结果,保证了代码覆盖率的要求。在SMIC0.13um的逻辑工艺下频率达到400MHz,电路规模等效于58.4k个与非门。通过门级网表仿真得出加入低功耗设计后动态功耗为54.8mW,降低了24.1%。
[Abstract]:With the development of information society, the applications of scientific research, industrial production, AI and 3D games have raised higher requirements for the performance of floating-point operation. Therefore, the floating point arithmetic units with low latency and high throughput are the key components in the design of all kinds of processors.
In the study of traditional floating point adder, and the realization method of Floating-Point Multiplier and floating point multiply add fused device structure, in this paper, a single cycle accumulation algorithm based on improved classical structure of FPU, add a loop accumulated in the pipeline, carry through retention so that the final sum algorithm module and post specifications the module can be completed, the cumulative floating point addition operation in a period, a substantial increase in the operational efficiency of the unit vector multiplication per cycle, a floating point multiply add. At the same time in order to meet the needs of more occasions, the design resource reuse support SIMD operations, making it compatible with double precision floating-point number. Two sets of single precision floating point, 32 of the number of symbols and two sets of 16 of the number of symbols, can perform addition, multiplication, multiply add fused and continuous multiply accumulate four kinds of operation, and the multiplier, lead zero detection module Optimization is done to reduce the delay and area. Finally, in view of the data flow characteristics of the structure, the low power technology of operating number isolation and gating clock is adopted.
The verification platform is constructed using SystemVerilog language to generate constrained random test vectors and automatic inspection results, ensure the code coverage requirements. In the logic process of SMIC0.13um under the frequency of 400MHz, the circuit scale is equivalent to the 58.4k NAND gate level netlist. Through simulation to low power design of dynamic power consumption of 54.8mW, reduce the 24.1%.

【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP332.2

【相似文献】

相关期刊论文 前10条

1 朱玉田,,徐君;高效浮点FFT的汇编语言程序编制[J];计算机应用研究;1996年05期

2 ;高速浮点处理器[J];计算机工程与应用;1983年03期

3 傅斌;486DLC一个浮点问题的解决办法[J];电脑;1996年01期

4 ;SGI TFP──最高浮点性能的RISC微处理器[J];导弹与航天运载技术;1994年01期

5 于春;浮点BASIC语言编程技巧[J];家用电器.消费;1994年09期

6 李五文;一个奇怪的CORE DUMP问题[J];电子科技;1998年07期

7 王建农;PL/M-51软件中实现浮点运算的方法[J];内蒙古科技与经济;2005年09期

8 周少武;如何安全创建TSR程序[J];湘潭工学院学报;1996年03期

9 ;让你的梦想加个“倍”──K6-2 3D now![J];软件世界;1998年01期

10 李伟;MMX2正在向时代走来[J];现代电子技术;1998年06期

相关会议论文 前10条

1 闵银皮;倪晓强;邢座程;;多线程向量浮点部件的验证方法[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

2 邓中华;仲伟亚;;DZH-16B多功能浮点地震仪在工程物探中的应用[A];1995年中国地球物理学会第十一届学术年会论文集[C];1995年

3 蒋景红;杨力;蔡惠智;侯卫民;;GPU在实时信号处理系统中应用的可行性研究[A];2009年全国水声学学术交流暨水声学分会换届改选会议论文集[C];2009年

4 陈敏;乔清泉;刘华东;丁善兵;;大空间、大跨度框架结构无黏结预应力现浇空心楼盖施工[A];建设工程混凝土应用新技术[C];2009年

5 王晓光;昃琳;刘涛;;CUDA构筑廉价的高性能计算平台[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年

6 Erik Hagersten;邓锡银;;帮软件找寻内存墙之门(第一部分)[A];工程三维模型与虚拟现实表现——第二届工程建设计算机应用创新论坛论文集[C];2009年

7 陈虹;宋磊;吴国清;;大规模数值模拟数据的无损压缩[A];中国工程物理研究院科技年报(2005)[C];2005年

8 朱红丽;;数字音频广播系统模型和硬件仿真[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年

9 郭磊;唐玉华;周杰;董亚卓;;基于FPGA的Cholesky分解细粒度并行结构与实现[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

10 金红新;吴简彤;刘凤举;;基于DSP的捷联导航计算机系统的硬件设计[A];2004年船舶仪器仪表学术年会论文集[C];2004年

相关重要报纸文章 前10条

1 计算机世界实验室 盘骏;实力的证明[N];计算机世界;2011年

2 001pc.com;按应用需求选择CPU[N];中国计算机报;2001年

3 ;用了PowerPC G4的高端彩激[N];中国计算机报;2006年

4 尚云山;AMD推首款高档专用“显卡”[N];电子资讯时报;2007年

5 广西 姑苏飘雪;“呼唤”渲染世界真色彩[N];电脑报;2004年

6 广东 林鸣;从4004到Athlon64(三)[N];电脑报;2004年

7 斯诺;PC按谁的规则玩[N];中国经营报;2001年

8 王寒辉;透视 CPU 的性能[N];中国电脑教育报;2000年

9 Eliot;推倒重来[N];中国电脑教育报;2003年

10 IT Boy;下一站天王NVIDIA?[N];中国电脑教育报;2008年

相关博士学位论文 前10条

1 陈立前;基于区间线性抽象域的可靠浮点及非凸静态分析[D];国防科学技术大学;2010年

2 姜浩;高精度可靠浮点计算及舍入误差分析研究[D];国防科学技术大学;2013年

3 姜忠鼎;基于深度全景视频的虚拟场景绘制技术研究[D];浙江大学;2004年

4 田红丽;可重构计算系统芯片中的动态数据调度模型及部件的研究[D];河北工业大学;2011年

5 张林生;数字信号处理系统的定点化技术研究[D];哈尔滨工业大学;2010年

6 杜学亮;定制指令与协处理器加速机制的研究[D];中国科学技术大学;2009年

7 王超;先进电力录波系统信息处理与数据压缩技术研究[D];哈尔滨工业大学;2010年

8 徐晓东;基于CCSDS IDC星载图像压缩算法的FPGA实现技术[D];山东大学;2011年

9 吴东晖;智能移动机器人的视觉导航技术[D];浙江大学;2001年

10 韩泽耀;高速高性能FFT处理器的VLSI实现研究[D];浙江大学;2002年

相关硕士学位论文 前10条

1 李丛;LEON3浮点部件控制器的研究与实现[D];大连理工大学;2010年

2 姜加红;面向浮点C程序的区间分析方法[D];国防科学技术大学;2012年

3 田甜;FT-XDSP中高性能SIMD浮点乘加单元的研究与实现[D];国防科学技术大学;2013年

4 罗雪苟;COFDM传输系统IFFT/FFT算法研究与FPGA实现[D];西安电子科技大学;2002年

5 何伟;设计高性能浮点加法器[D];合肥工业大学;2004年

6 刘凌;P1750A浮点执行部件的设计与实现[D];西北工业大学;2001年

7 杨国刚;机器人大脑浮点化及其半物理仿真架构研究[D];长安大学;2011年

8 程俊;浮点FFT的VHDL实现及HDL功能测试方法的研究[D];湖南大学;2004年

9 许向荣;基于DSP的便携式双通道信号分析仪的研究[D];华北电力大学(河北);2003年

10 张博为;可重构系统中快速高斯消元算法的并行硬件体系实现[D];哈尔滨工程大学;2009年



本文编号:1427199

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1427199.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2c1ad***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com