当前位置:主页 > 科技论文 > 电子信息论文 >

基于FPGA的矩阵乘法实现方案在全连接深度神经网络前向传播中的性能评估

发布时间:2020-03-28 02:06
【摘要】:矩阵乘法作为矩阵计算的基本计算之一,被广泛运用于人工神经网络实现方案中。作为人工神经网络的主要实现平台之一,现场可编程门阵列(Field Programmable Gate Array,FPGA)的矩阵乘法实现方案,直接决定了相关硬件实现方案的计算效率,并得到了广泛地研究。目前,有关基于FPGA平台进行矩阵乘法的研究内容多偏向于具体的硬件实现方案,有关硬件设计与资源占用的评估尚较为缺乏。通过对三种基于FPGA平台的矩阵乘法设计方案进行参数化性能评估,本文对针对深度神经网络(Deep Neural Network,DNN)中的矩阵相乘方案的适用性进行了讨论。作为实现DNN前向传播的基础,基于乘加器和乘累加器的单层神经网络计算方案被提出。通过对此两种实现方法在数字信号处理单元(Digital Signal Processor,DSP)、查找表(Look Up Table,LUT)和寄存器(Register,REG)等硬件资源使用情况和时序表现分析,对两种基础实现方案的性能进行了对比。通过对基础矩阵乘法设计方案进行级联,可以得到针对多层DNN前向传播的矩阵乘法实现方案。根据硬件资源耗费和时序表现分析,在实现同等规模矩阵乘法的情况下,基于乘累加器的实现方案较基于乘加器的实现方案表现更优。由于多层DNN与单层DNN前向传播的资源占用不成线性关系,通过对不同规模的DNN进行硬件实现,可以对DNN前向传播实现方案的资源占用情况进行参数化评估。综合乘累加器和乘加器的矩阵乘法实现方案,一种针对具有奇数个隐含层DNN的混合矩阵乘法实现方法被提出。通过手写数字识别任务的验证和基于赛灵思(Xilinx)VC707平台的实测结果,该矩阵乘法混合实现方案准确有效,并较乘累加器方法节省了 13%的片上资源。
【图文】:

示意图,激励函数,示意图,基本函数


据中的冗余,这是神经网络能够解决非线性问题的关键。逡逑目前,常用的激活函数主要有Sigmoid,tanh,ReLU以及它们的一些变体。逡逑这三种基本函数的图像与公式分别如图3-2和式(3-1)-式(3-3)所示。逡逑16逡逑

关系图,计算单元,流程计算,累加器


计算单元的计算时间是可以通过设计的时序流程计算出来的,因此主要通过逡逑仿真来验证理论数据是否正确。通过仿真验证的计算时间与网络节点数的关系如逡逑图3-8所示。逡逑4奍加A?案Vi点被1iil逦的X、系逡逑150邋1逡逑^逦/逡逑0逦/逡逑登伽'逦/逡逑0逡逑0邋/逡逑I邋50'?逡逑3逦/逡逑z邋0、逦/逡逑80邋/逡逑60邋80逡逑40邋60逡逑20邋\一一一^逦40逡逑0邋0逡逑Number邋of邋input邋Nodes逡逑Number邋of邋Output邋Nodes逡逑图3-8基于乘累加器IP核的单层网络计算时间与网络节点数关系图逡逑通过观察和分析,并结合ISE提供的资源报告,可以得出:逡逑1、在该方案中,硬件资源的占用主要与输出层节点数有关,而与输入层节逡逑点数无关,,这与乘累加器IP核的并行结构设计符合。逡逑22逡逑
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN791;TP183

【参考文献】

相关期刊论文 前10条

1 韩建勋;;并行计算在矩阵运算中的应用[J];信息与电脑(理论版);2017年05期

2 山世光;阚美娜;刘昕;刘梦怡;邬书哲;;深度学习:多层神经网络的复兴与变革[J];科技导报;2016年14期

3 尹孟嘉;许先斌;熊曾刚;张涛;;GPU矩阵乘法的性能定量分析模型[J];计算机科学;2015年12期

4 乔瑞秀;鲁华祥;龚国良;陈刚;;并行可配置浮点矩阵乘法IP核设计[J];网络新媒体技术;2015年06期

5 尹宝才;王文通;王立春;;深度学习研究综述[J];北京工业大学学报;2015年01期

6 刘进锋;;一种简洁高效的加速卷积神经网络的方法[J];科学技术与工程;2014年33期

7 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期

8 刘沛华;鲁华祥;龚国良;刘文鹏;;基于FPGA的全流水双精度浮点矩阵乘法器设计[J];智能系统学报;2012年04期

9 孙志军;薛磊;许阳明;王正;;深度学习研究综述[J];计算机应用研究;2012年08期

10 刘进锋;郭雷;;CPU与GPU上几种矩阵乘法的比较与分析[J];计算机工程与应用;2011年19期

相关硕士学位论文 前10条

1 曲省卫;深度非负矩阵分解算法研究[D];重庆邮电大学;2016年

2 周凯龙;基于深度学习的图像识别应用研究[D];北京工业大学;2016年

3 余奇;基于FPGA的深度学习加速器设计与实现[D];中国科学技术大学;2016年

4 杨程;基于FPGA的人工神经网络的研究与实现[D];西安电子科技大学;2016年

5 黄倩;一种基于FPGA的神经网络分类系统的设计与实现[D];云南大学;2015年

6 张建华;基于深度学习的语音识别应用研究[D];北京邮电大学;2015年

7 刘培龙;基于FPGA的神经网络硬件实现的研究与设计[D];电子科技大学;2012年

8 安婧;基于FPGA的高速矩阵运算算法研究[D];中北大学;2009年

9 林皓;基于FPGA的矩阵运算实现[D];南京理工大学;2007年

10 包晗;FPGA器件的应用研究[D];大连海事大学;2006年



本文编号:2603754

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2603754.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7cfa8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com