基于FPGA的卷积神经网络加速方法研究及实现
发布时间:2022-01-17 09:39
随着深度学习技术在众多领域的广泛使用,作为其基础模型的卷积神经网络(Convolutional Neutral Network,CNN)也越来越受重视,被广泛应用在图像分类、人脸识别、语言检测、文档分析等诸多领域。但是仅用软件方式加速卷积神经网络已经不能满足日益增长的速度与功耗要求,如何利用硬件设计卷积神经网络加速器已经成为学术领域的研究热点。FPGA(Field-Programmable Gate Array)作为并行化的计算密集型加速硬件,拥有卓越的性能功耗比,对比GPU、ASIC具有独特优势。但是实际使用中,如何高效地利用FPGA有限的片上资源,以较少的资源获得更高的性能,如何设计出更通用的FPGA硬件架构或模块都存在巨大的挑战。本文提出了一种高效卷积模块ECM(Efficient Convolutional Module),它包含4个PE(Processing Element)单元,每个PE单元负责一张输出特征图的计算,采用级联串推的方式在PE单元间传递卷积数据和卷积参数。为了解决层串行模式反复读写外部存储器的问题,制定了双缓冲的存储机制用于将中间计算结果存储到FPGA片内。并...
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
生物神经元及人工神经元结构
图 2-2 多层全连接前向神经网络结构卷积神经网络作为神经网络的基础模型之一,区别于一般网络有两大特点,一是不同于全连接网络,卷积神经网络的各个神经元之间采用稀疏连接的方式,二是同一层中的部分神经元之间共享权值。这两大特点大大减少了网络的权值数量,并且降低了网络的复杂度。将图像直接作为输入时卷积神经网络的优势更大,免去了传统图像识别算法中繁琐的数据重建和特征提取过程。图像经过多次的卷积核滤波和子抽样后,便提取到了显著的特征,而且卷积神经网络对图像的变形如平移、缩放、倾斜等具有自适应性。因此,多年来卷积神经网络一直是人工神经网络方面的研究热点,在图像识别,机器视觉,自动翻译等诸多领域得到了愈加广泛的应用。2.1.2 卷积神经网络基本网络结构卷积神经网络的典型网络结构如下图2-3所示。通常图像作为原始输入,经过交替出现的卷积层提取特征和池化层子抽样后,得到多张特征图,在网络的最后通过全连接层运算得出结果。
图 2-2 多层全连接前向神经网络结构卷积神经网络作为神经网络的基础模型之一,区别于一般网络有两大特点,一是不同于全连接网络,卷积神经网络的各个神经元之间采用稀疏连接的方式,二是同一层中的部分神经元之间共享权值。这两大特点大大减少了网络的权值数量,并且降低了网络的复杂度。将图像直接作为输入时卷积神经网络的优势更大,免去了传统图像识别算法中繁琐的数据重建和特征提取过程。图像经过多次的卷积核滤波和子抽样后,便提取到了显著的特征,而且卷积神经网络对图像的变形如平移、缩放、倾斜等具有自适应性。因此,多年来卷积神经网络一直是人工神经网络方面的研究热点,在图像识别,机器视觉,自动翻译等诸多领域得到了愈加广泛的应用。2.1.2 卷积神经网络基本网络结构卷积神经网络的典型网络结构如下图2-3所示。通常图像作为原始输入,经过交替出现的卷积层提取特征和池化层子抽样后,得到多张特征图,在网络的最后通过全连接层运算得出结果。
【参考文献】:
期刊论文
[1]低资源语音识别中融合多流特征的卷积神经网络声学建模方法[J]. 秦楚雄,张连海. 计算机应用. 2016(09)
[2]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
[3]卷积神经网络的FPGA并行加速方案设计[J]. 方睿,刘加贺,薛志辉,杨广文. 计算机工程与应用. 2015(08)
[4]基于卷积神经网络的手势识别初探[J]. 蔡娟,蔡坚勇,廖晓东,黄海涛,丁侨俊. 计算机系统应用. 2015(04)
[5]基于ZYNQ的稠密光流法软硬件协同处理[J]. 王芝斌,阳文敏,张圆蒲,柴志雷. 计算机工程与应用. 2014(18)
[6]基于OpenCL的FPGA设计优化方法研究[J]. 范兴山,彭军,黄乐天. 电子技术应用. 2014(01)
[7]FPGA结构设计方法及EDA工具[J]. 张峰,李艳,陈亮,李明,于芳. 微电子学与计算机. 2013(05)
[8]基于嵌入式GPU虚拟仪表图形软件的实现[J]. 郭云,康涛. 计算机系统应用. 2012(10)
[9]基于GPU的多点触控图像处理技术[J]. 裘皓萍,冯瑞,万时华. 计算机工程. 2012(01)
本文编号:3594498
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
生物神经元及人工神经元结构
图 2-2 多层全连接前向神经网络结构卷积神经网络作为神经网络的基础模型之一,区别于一般网络有两大特点,一是不同于全连接网络,卷积神经网络的各个神经元之间采用稀疏连接的方式,二是同一层中的部分神经元之间共享权值。这两大特点大大减少了网络的权值数量,并且降低了网络的复杂度。将图像直接作为输入时卷积神经网络的优势更大,免去了传统图像识别算法中繁琐的数据重建和特征提取过程。图像经过多次的卷积核滤波和子抽样后,便提取到了显著的特征,而且卷积神经网络对图像的变形如平移、缩放、倾斜等具有自适应性。因此,多年来卷积神经网络一直是人工神经网络方面的研究热点,在图像识别,机器视觉,自动翻译等诸多领域得到了愈加广泛的应用。2.1.2 卷积神经网络基本网络结构卷积神经网络的典型网络结构如下图2-3所示。通常图像作为原始输入,经过交替出现的卷积层提取特征和池化层子抽样后,得到多张特征图,在网络的最后通过全连接层运算得出结果。
图 2-2 多层全连接前向神经网络结构卷积神经网络作为神经网络的基础模型之一,区别于一般网络有两大特点,一是不同于全连接网络,卷积神经网络的各个神经元之间采用稀疏连接的方式,二是同一层中的部分神经元之间共享权值。这两大特点大大减少了网络的权值数量,并且降低了网络的复杂度。将图像直接作为输入时卷积神经网络的优势更大,免去了传统图像识别算法中繁琐的数据重建和特征提取过程。图像经过多次的卷积核滤波和子抽样后,便提取到了显著的特征,而且卷积神经网络对图像的变形如平移、缩放、倾斜等具有自适应性。因此,多年来卷积神经网络一直是人工神经网络方面的研究热点,在图像识别,机器视觉,自动翻译等诸多领域得到了愈加广泛的应用。2.1.2 卷积神经网络基本网络结构卷积神经网络的典型网络结构如下图2-3所示。通常图像作为原始输入,经过交替出现的卷积层提取特征和池化层子抽样后,得到多张特征图,在网络的最后通过全连接层运算得出结果。
【参考文献】:
期刊论文
[1]低资源语音识别中融合多流特征的卷积神经网络声学建模方法[J]. 秦楚雄,张连海. 计算机应用. 2016(09)
[2]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
[3]卷积神经网络的FPGA并行加速方案设计[J]. 方睿,刘加贺,薛志辉,杨广文. 计算机工程与应用. 2015(08)
[4]基于卷积神经网络的手势识别初探[J]. 蔡娟,蔡坚勇,廖晓东,黄海涛,丁侨俊. 计算机系统应用. 2015(04)
[5]基于ZYNQ的稠密光流法软硬件协同处理[J]. 王芝斌,阳文敏,张圆蒲,柴志雷. 计算机工程与应用. 2014(18)
[6]基于OpenCL的FPGA设计优化方法研究[J]. 范兴山,彭军,黄乐天. 电子技术应用. 2014(01)
[7]FPGA结构设计方法及EDA工具[J]. 张峰,李艳,陈亮,李明,于芳. 微电子学与计算机. 2013(05)
[8]基于嵌入式GPU虚拟仪表图形软件的实现[J]. 郭云,康涛. 计算机系统应用. 2012(10)
[9]基于GPU的多点触控图像处理技术[J]. 裘皓萍,冯瑞,万时华. 计算机工程. 2012(01)
本文编号:3594498
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3594498.html