基于LU分解的矩阵求逆运算的硬件实现与验证
本文关键词:基于LU分解的矩阵求逆运算的硬件实现与验证,,由笔耕文化传播整理发布。
【摘要】:矩阵运算是科学与工程计算中的基本运算,广泛应用于数字信号处理和图像处理等各个领域。上述应用领域的实时性要求很高,为加快矩阵运算速度,需采用硬件实现的方法。而矩阵求逆运算是简化和解决很多问题的关键环节,其执行速度对整个系统的效率有重要的影响。针对现有的矩阵求逆硬件实现方法大多有硬件资源复杂度大、存储资源需求大或仅适用于低阶矩阵等缺陷,本文提出了一种基于LU分解的矩阵求逆运算的硬件实现方法。该方法基于简单的加减乘除运算单元,设计了三个计算模块完成矩阵求逆运算,通过重构的方式实现各个模块的运算,节约了超过50%的硬件资源,具有低功耗、低硬件资源复杂度的特点;并对三个模块分别设计了并行化方法,并设定相应的存储规则以实现并行访存,根据硬件资源本设计采用四路并行的方式,有效提高了运算效率和硬件资源利用率。随着SoC设计技术遵循摩尔定律规律快速发展,芯片规模和功能的急剧膨胀也导致了验证复杂度的快速增长,验证的工作量指数级增长,验证效率越来越成为制约设计效率的瓶颈。传统的验证方法已经无法满足对于大规模的复杂的芯片设计的验证。因而,近年来不断涌现出大量新的高级验证方法学。面对利用重构方式实现的矩阵求逆设计,需要对大量的不同阶数的矩阵数据进行验证,本文采用了目前验证技术的最新进展UVM (Universal Verification Methodology)验证方法学,搭建了一个高效、高度自动化、可重用的验证平台,极大地提高了验证效率。通过随机约束结合随机产生激励的方式,生成所需的矩阵求逆设计的配置信息以及随机的矩阵数据,通过大量的随机测试可以快速达到功能覆盖率100%的要求,保证模块设计的功能正确性。同时,通过运行时间的统计以及计算精度的统计,对设计模块的性能方面进行分析。最终得到对矩阵求逆模块设计的完备的验证结果。
【关键词】:矩阵求逆 LU分解 硬件实现 UVM验证方法学
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP332
【目录】:
- 摘要4-6
- Abstract6-13
- 第1章 绪论13-17
- 1.1 研究背景13-16
- 1.1.1 矩阵求逆13-14
- 1.1.2 验证方法学14-16
- 1.2 课题来源16
- 1.3 论文主要工作与组织结构16-17
- 第2章 可配置专用处理核RASP介绍17-25
- 2.1 RASP总体架构17-19
- 2.2 RASP核工作方式19-21
- 2.2.1 RASP核工作模式19
- 2.2.2 DSP核对RASP核的配置19-21
- 2.3 可重构设计21-25
- 2.3.1 重构控制器21-22
- 2.3.2 可重构计算阵列22-23
- 2.3.3 重构实现流程23-25
- 第3章 基于LU分解的矩阵求逆RTL设计25-41
- 3.1 基于LU分解的矩阵求逆算法25-28
- 3.1.1 LU分解25-27
- 3.1.2 三角矩阵求逆27-28
- 3.1.3 矩阵乘28
- 3.2 整体架构设计28-29
- 3.3 子功能模块设计29-40
- 3.3.1 LU分解模块29-33
- 3.3.1.1 硬件电路结构设计29-32
- 3.3.1.2 重构实现32
- 3.3.1.3 并行存储方案32-33
- 3.3.2 三角矩阵求逆模块33-38
- 3.3.2.1 硬件电路结构设计33-36
- 3.3.2.2 重构实现36-37
- 3.3.2.3 并行存储方案37-38
- 3.3.3 矩阵乘模块38-40
- 3.3.3.1 硬件电路结构设计38
- 3.3.3.2 重构实现38-39
- 3.3.3.3 并行存储方案39-40
- 3.4 小结40-41
- 第4章 矩阵求逆设计模块的UVM验证41-69
- 4.1 UVM验证方法学41-51
- 4.1.1 UVM简介41-42
- 4.1.2 UVM验证平台42-43
- 4.1.3 UVM的重要机制43-51
- 4.1.3.1 类机制43-45
- 4.1.3.2 factory机制45-46
- 4.1.3.3 phase机制46-48
- 4.1.3.4 objection机制48
- 4.1.3.5 TLM机制48-49
- 4.1.3.6 sequence机制49-50
- 4.1.3.7 register model机制50
- 4.1.3.8 config机制50-51
- 4.2 矩阵求逆设计模块的UVM验证方案51-63
- 4.2.1 UVM验证平台搭建51-55
- 4.2.2 验证平台中组件的实现方法55-63
- 4.2.2.1 sequence55-56
- 4.2.2.2 sequence_item(transaction)56-58
- 4.2.2.3 interface58
- 4.2.2.4 driver58-60
- 4.2.2.5 monitor60
- 4.2.2.6 C_MODEL60-61
- 4.2.2.7 测试testcase61-62
- 4.2.2.8 top顶层模块62-63
- 4.3 测试计划63-64
- 4.3.1 寄存器配置63
- 4.3.2 功能测试点63-64
- 4.4 验证结果与分析64-67
- 4.4.1 功能正确性和性能统计64-66
- 4.4.2 计算精度66
- 4.4.3 代码覆盖率66-67
- 4.5 本章小结67-69
- 第5章 总结与展望69-71
- 5.1 全文总结69
- 5.2 未来展望69-71
- 参考文献71-75
- 攻读硕士学位期间的工作和成果75-76
- 致谢76-77
【相似文献】
中国期刊全文数据库 前10条
1 杨丰瑞;熊军洲;;基于Verilog的下三角矩阵求逆设计与实现[J];广东通信技术;2011年04期
2 何承源,胡明;关于两类循环矩阵求逆的一种快速算法[J];数值计算与计算机应用;1998年04期
3 刘千里;;基于FPGA的逆QR分解SMI算法的并行实现方法[J];计算机工程与应用;2012年26期
4 魏婵娟;张春水;刘健;;一种基于Cholesky分解的快速矩阵求逆方法设计[J];电子设计工程;2014年01期
5 郭圣权;;矩阵求逆的递推计算法[J];自动化仪表;1986年02期
6 李颖异;;改进的矩阵求逆的FPGA设计和实现[J];中国有线电视;2006年07期
7 王锐;胡永华;马亮;杜福慧;;任意维矩阵求逆的FPGA设计与实现[J];中国集成电路;2007年04期
8 岳国英;计算机使用经验与技巧[J];河北水利专科学校学报;1991年01期
9 李涛;张忠培;;矩阵求逆的FPGA实现[J];通信技术;2010年11期
10 王前,吴淑泉,李韬,冼志妙;三角矩阵求逆的ASIC实现研究[J];微电子学与计算机;2004年08期
中国重要会议论文全文数据库 前2条
1 刘桂清;;一个矩阵求逆的并行算法[A];数学·力学·物理学·高新技术交叉研究进展——2010(13)卷[C];2010年
2 宋端磊;鹿涛;乔园园;;大型矩阵求逆的实现与应用[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
中国硕士学位论文全文数据库 前5条
1 虞潇;高阶三角矩阵求逆的VLSI设计与实现[D];南京大学;2014年
2 杨丹;基于LU分解的矩阵求逆运算的硬件实现与验证[D];南京大学;2014年
3 田佳月;基于FPGA的采样矩阵求逆算法的硬件实现[D];哈尔滨工程大学;2013年
4 林皓;基于FPGA的矩阵运算实现[D];南京理工大学;2007年
5 潘晓;WiMAX系统可配置MIMO检测技术研究[D];上海交通大学;2009年
本文关键词:基于LU分解的矩阵求逆运算的硬件实现与验证,由笔耕文化传播整理发布。
本文编号:324925
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/324925.html