面向图像识别的卷积神经网络加速器研究
发布时间:2020-12-24 02:55
近年来,卷积神经网络算法在计算机视觉领域取得越来越突出的成就。信息时代数据的爆炸让算法“学”得越来越多,集成电路的发展提供的强大计算能力让算法“学”得越来越快。但是,算法在取得越来越好的效果的同时,复杂度也越来越高。另一方面,智能手机、机器人、智能驾驶等技术开始广泛应用,而在这些应用场合下,由于隐私、实时性强等要求,大部分应用只能进行本地运算,传统的通用处理器架构并不适合算法的实时运算,所以有必要对算法的加速进行探索研究。本文具体工作和创新如下:1、本文训练了基于卷积神经网络的人脸识别算法,并基于该算法搭建了人脸检测系统,该系统试验结果表明本文训练的人脸识别算法具有一定实用性;另外,本文也训练了基于卷积神经网络的数字识别算法;两个算法都达到了较高的识别准确率。2、本文针对卷积神经网络算法难以在传统处理器进行实时计算这一问题,采用了一些设计方法,提出一种卷积神经网络加速器架构。该架构针对算法密集的乘累加计算设计专用的乘累加计算单元;根据数据可重用性,设计不同的缓存级数用于对数据进行重用,减少额外的访存;依据卷积神经网络算法的并行性将计算单元设计成可并行模式,并将计算架构设计成并行可配置形...
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
激活函数
面向图像识别的卷积神经网络加速器研究,而多维卷积的计算不仅要频繁的访问参数数据,而征图,这也会造成频繁的读取特征图数据,所以多维,还要考虑频繁的访存。很多基于卷积神经网络的加对外的访存,如 diannao[14]采用片内片外存储相结合之后,先进行缓存,缓存的数据要充分利用,再从片外示的多种存储结构,来访问数据,NBin 和 SB 分别
图 3. 4 一维卷积计算波形图下图 3.5 中,把一维卷积的计算单元命名为 PE,由上面讨论可知,一个 PE 可以计算一行部分和,如果布置多个 PE,把第一行输出的部分和全部计算出来,然后把这些部分和累加起来就得到二维卷积输出的第一行,如果继续布置 PE,可以把二维卷积的另外几行计算出来,从而完成图片的二维卷积。PEp3 p2w3 w2 w1op5 p4p1部分和*=ROW1 * ROW1PE2ROW1 * ROW1PE3ROW1 * ROW1PE1部分和部分和ROW1'ROW1ROW2ROW3ROW1ROW2ROW3ROW1'图 3. 5 二维卷积电路结构图
【参考文献】:
期刊论文
[1]一种新型2-D卷积器的FPGA实现[J]. 桑红石,廖定彬,江威. 微电子学与计算机. 2011(09)
[2]基于FPGA的32位并行乘法器的设计与实现[J]. 蒋勇,罗玉平,马晏,叶新. 计算机工程. 2005(23)
本文编号:2934840
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
激活函数
面向图像识别的卷积神经网络加速器研究,而多维卷积的计算不仅要频繁的访问参数数据,而征图,这也会造成频繁的读取特征图数据,所以多维,还要考虑频繁的访存。很多基于卷积神经网络的加对外的访存,如 diannao[14]采用片内片外存储相结合之后,先进行缓存,缓存的数据要充分利用,再从片外示的多种存储结构,来访问数据,NBin 和 SB 分别
图 3. 4 一维卷积计算波形图下图 3.5 中,把一维卷积的计算单元命名为 PE,由上面讨论可知,一个 PE 可以计算一行部分和,如果布置多个 PE,把第一行输出的部分和全部计算出来,然后把这些部分和累加起来就得到二维卷积输出的第一行,如果继续布置 PE,可以把二维卷积的另外几行计算出来,从而完成图片的二维卷积。PEp3 p2w3 w2 w1op5 p4p1部分和*=ROW1 * ROW1PE2ROW1 * ROW1PE3ROW1 * ROW1PE1部分和部分和ROW1'ROW1ROW2ROW3ROW1ROW2ROW3ROW1'图 3. 5 二维卷积电路结构图
【参考文献】:
期刊论文
[1]一种新型2-D卷积器的FPGA实现[J]. 桑红石,廖定彬,江威. 微电子学与计算机. 2011(09)
[2]基于FPGA的32位并行乘法器的设计与实现[J]. 蒋勇,罗玉平,马晏,叶新. 计算机工程. 2005(23)
本文编号:2934840
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2934840.html