FPGA实现的可编程神经网络处理器

发布时间：2021-03-27 07:40

　　深度学习是人工智能领域进入新世纪以来最重要的突破之一。它在图像识别、计算机视觉和自然语言处理等众多领域都取得了惊人的成就。尤其是卷积神经网络（Convolutional Neural Network）简称CNN,更是深度学习中的翘楚。当前卷积神经网络算法正在不断演进,从LeNet、AlexNet、到GoogleNet和VGGNet等,经典的CNN网络层出不穷;从CNN、R-CNN、Fast R-CNN到Faster R-CNN和R-FCN不断推陈出新。基于CNN的重要性和灵活性,应抓紧促进其落地应用。CNN及其衍生算法的多样性决定了直接使用ASIC加速计算是比较有挑战性的。此外卷积神经网络存在着结构多样和数据交换量大的问题。针对上述问题,本研究提出了FPGA实现的可编程神经网络处理器。系统采用传输触发架构结合多通道DMA、多端口存储器和专用池化通道组成数据传输网络有效解决了网络结构适应性及海量数据交换的问题。实验表明,本系统在处理VGG16网络时,吞吐速率达到197.1GOPS。本方案具有系统并行度大、可编程、可在线配置和处理速度较高的特点。文章首先介绍了卷积神经网络的背景和发展现状;...

【文章来源】：西安电子科技大学陕西省 211工程院校教育部直属院校

【文章页数】：80 页

【学位级别】：硕士

【部分图文】：

FPGA实现的可编程神经网络处理器

神经元示意图

网络结构图,多层感知器,多层神经网络,稀疏特性

构设计提供必要的理论指导。为此本章围绕三个方面介绍卷积神经网络：经典网络介绍，不同层类型介绍和非线性函数统计分析。2.2.1 卷积神经网络介绍卷积神经网络的前身是多层感知器，即上一个小结介绍的多层神经网络。虽然多层神经网络已经能逼近任意函数，但当神经网络超过三层以后，会产生梯度消失的问题，这导致了其难以训练。因此，很多学者一直在致力于寻找一种训练深层网络的方法。受到生物眼中感受野概念的启发，LeCun 于 1998[1]提出了第一个卷积神经网络，其架构如图 2.4 所示，相比之前的多层感知器，该方法利用了稀疏特性，通过权值共享有效减少了深层神经网络的参数数量；其中还加入了池化函数，这使得该网络在一定程度上对旋转、平移和放缩具有很好的鲁棒性。

网络结构图,卷积核,图像处理算法,网络参数

图2.5 AlexNet 网络结构图[17]2015 年 Simonyan 等人[18]提出了规模达到520M卷积神经神经网络，即VGGNet。其结构如图 2.6 所示。该网络所有的卷积核尺寸都是 3 的，其泛化能力很强，用在了很多最新的图像处理算法当中。224x224@3224x224@64112x112@12856x56@25628x28@51214x14@512 7x7@5121x1@40961x1@1000softmax最大池化层所有卷积核尺寸=3x3最大池化层最大池化层最大池化层最大池化层图2.6 VGG16 网络结构图2014 年的 GoogleNet(Inception-V1)[19]是一个很高效的网络，其网络参数比VGG16

【参考文献】：
期刊论文
[1]传输触发架构的可编程神经网络处理器设计[J]. 赵博然,张犁,石光明,黄蓉,徐欣冉.  西安电子科技大学学报. 2018(04)
[2]面向OpenGL的图形加速器设计与实现[J]. 邓军勇,李涛,蒋林,韩俊刚,沈绪榜.  西安电子科技大学学报. 2015(06)
[3]一种用于实时图像处理的众核结构设计[J]. 刘镇弢,李涛,黄虎才,韩俊刚,沈绪榜.  西安电子科技大学学报. 2015(02)

本文编号：3103178

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3103178.html

上一篇：一种高性能多接口加固笔记本
下一篇：多级电平闪存信道下的LDPC码动态译码算法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|