一种降低迭代运算误差的FMA结构研究
本文选题:浮点融合乘加 + 迭代运算 ; 参考:《国防科学技术大学》2012年硕士论文
【摘要】:在新一代面向应用的多核微处理器的设计中,设计者引入可以显著提高浮点运算性能的融合乘加部件(Fused Multiply-Add,FMA)。与浮点乘法、浮点加法独立执行所不同,融合乘加部件在执行过程中只有一次舍入操作,降低了运算结果的误差。但是,迭代运算的误差随着运算次数的增加而显著增大,从而严重影响运算结果的可靠程度。本文在分析传统融合乘加结构(T-FMA)的基础上研究改进的降低迭代运算误差的FMA结构(IM-FMA)。 本文所取得的主要研究成果包括以下几个方面: 1、研究了当前FMA的常见算法和结构以及在大规模数值计算中运算误差所造成的影响,分析了浮点数据系统的分布特点——规格化数据的唯一性和有限区间内的均匀性、计算推导出了不同数据格式在对数分布下的MRRE和ARRE,综述了IEEE754-2008标准所规定的二进制数据格式、异常处理以及误差分析的基础知识。 2、建立了适用于浮点迭代运算误差分析的数学模型,分析推导了FMA部件在执行迭代运算过程中产生误差的决定因素——运算次数n和舍入单元u。在运算次数相同的情况下,舍入单元越小迭代运算的误差越小,所以降低迭代运算误差的根本方法在于降低舍入单元。 3、提出了一种降低迭代运算误差的FMA结构(IM-FMA)。本文摒弃了以往在执行单次运算和迭代运算过程中都只保留有限位宽(53位)尾数的做法,增加了从规格化移位操作之后、舍入操作之前的中间结果(106位)到加数的反馈通路,并通过特定的选择模块来区别参与单次运算模式和迭代运算模式的加数来源。同时,研究了IM-FMA结构中关键子模块——乘法模块、加数对阶移位和前导零预测所采用的算法、结构和逻辑电路实现方法。 4、验证测试了所实现的T-FMA和IM-FMA,然后执行两个迭代测试序列分别得到T-FMA和IM-FMA的运算结果。在测试序列1下T-FMA运算结果的绝对误差为252100、相对误差为1.1102E-14,,IM-FMA运算结果的绝对误差为0、相对误差也为0;在测试序列2下T-FMA的绝对误差为(2521)100、相对误差为1.1102E-14,IM-FMA的绝对误差为100、相对误差为2.4652E-30,所以IM-FMA与T-FMA相比在降低迭代运算误差方面是有效的。
[Abstract]:In the design of a new generation of application-oriented multi-core microprocessors, the designer introduces the fused multiplicative addition component (Fused Multiply-Add-FMAA), which can significantly improve the performance of floating-point computing. Unlike floating-point multiplication, floating-point addition performs independently, the fused multiplicative unit rounding only once in the execution process, thus reducing the error of the result. However, the error of iterative operation increases significantly with the increase of the number of operations, which seriously affects the reliability of the results. In this paper, based on the analysis of the traditional fusion multiplication and addition structure (T-FMA), an improved FMA structure to reduce the error of iterative operation is studied. The main research results of this paper include the following aspects: 1. The common algorithms and structures of FMA and the influence of operational errors in large-scale numerical computation are studied, and the distribution characteristics of floating point data system are analyzed, such as the uniqueness of normalized data and the uniformity in finite interval. The MRRE and ARREs of different data formats under logarithmic distribution are derived, and the basic knowledge of binary data format, exception handling and error analysis in IEEE754-2008 standard is summarized. 2. A mathematical model for the error analysis of floating-point iterative operation is established, and the determinants of errors in the iterative operation of FMA are analyzed and deduced, which are the number of operations n and the rounding unit u. In the case of the same number of operations, the smaller the rounding unit, the smaller the error of iterative operation, so the fundamental method to reduce the error of iterative operation is to reduce the rounding unit. 3. A FMA structure to reduce the error of iterative operation is proposed. In this paper, we abandon the practice of retaining only the finite bit width of 53 bits) Mantissa in the process of single operation and iterative operation, and increase the feedback path from the intermediate result of 106 bits rounding before the operation after the normalized shift operation to the addition. The addition sources of single operation mode and iterative operation mode are distinguished by specific selection modules. At the same time, the algorithm, structure and realization method of logic circuit are studied for the key sub-module of IM-FMA, multiplication module, addition pair shift and leading zero prediction. 4. The implemented T-FMA and IM-FMA are verified and tested, and then two iterative test sequences are executed to get the results of T-FMA and IM-FMA. Under test sequence 1, the absolute error of T-FMA operation is 252100, the relative error is 1.1102E-14 IM-FMA, the relative error is 0, and the absolute error of T-FMA under test sequence 2 is 2521 100, the relative error is 1.1102E-14IM-FMA, the absolute error is 1.1102E-14IM-FMA. The relative error is 2.4652E-30, so IM-FMA is effective in reducing iterative error compared with T-FMA.
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP332
【共引文献】
相关期刊论文 前10条
1 许盛;高明伦;李伟;娄孝祥;;一种可重用MCU核测试平台的设计[J];电子测量技术;2008年01期
2 许盛;易浩勇;;异步FIFO在USB2.0控制器中的应用[J];电子测量技术;2009年08期
3 魏芳;刘志军;马克杰;;基于Verilog HDL的异步FIFO设计与实现[J];电子技术应用;2006年07期
4 张骋;蔡惠智;何国建;;基于CPCI总线多DSP系统的高速主机接口设计[J];电子技术应用;2007年12期
5 毕卫红;杨焰文;张燕君;;分布式光纤温度传感系统中数据处理的FPGA设计[J];电子技术应用;2008年09期
6 周汇;俞军;程君侠;华霞;;浮点乘法验证中的一种边界点测试方法[J];复旦学报(自然科学版);2008年01期
7 何清平;刘佐濂;江建钧;;Verilog语言综合问题研究[J];广州大学学报(自然科学版);2006年05期
8 王洋;刘卫东;于岗;;基于AMBA APB总线NandFlash控制器的设计研究[J];电子设计工程;2011年20期
9 丁世勇;谭文文;李桂英;;基于FPGA的以太网MAC控制器的设计与实现[J];电子设计工程;2011年21期
10 邹连英;余峰;;Xilinx DDR2 IP核控制器设计[J];舰船电子工程;2012年06期
相关会议论文 前1条
1 张均军;叶星宁;;一种充电管理芯片的可测性设计[A];四川省电子学会半导体与集成技术专委会2006年度学术年会论文集[C];2006年
相关硕士学位论文 前10条
1 刘仍稳;ASIP的流水线以及参量化设计[D];西安电子科技大学;2011年
2 张欣舒;基于FPGA的实时影像监控系统的研究与实现[D];杭州电子科技大学;2011年
3 张建龙;安全SD卡SoC芯片的SPI接口设计与实现[D];辽宁大学;2011年
4 邱晓光;AVS视频解码芯片功能验证平台的研究与实现[D];山东大学;2011年
5 马成海;兼容AMBA4的DDRn SDRAM控制器IP核的前端设计[D];山东大学;2011年
6 李风志;基于OpenRISC 1200的AVS解码器软件控制器的实现[D];山东大学;2011年
7 赵静;基于FPGA的数字频谱分析仪的设计与实现[D];山东大学;2011年
8 王晓晖;SDH网络分析仪发送端电路的设计与实现[D];杭州电子科技大学;2009年
9 李萌;边界扫描测试与故障诊断系统开发[D];哈尔滨工业大学;2010年
10 高健博;以太网二层交换芯片的MAC地址交换器的设计与实现[D];哈尔滨工业大学;2011年
本文编号:1844079
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1844079.html