当前位置:主页 > 科技论文 > 电子信息论文 >

面向FPGA的卷积神经网络优化裁剪算法研究

发布时间:2020-09-21 18:54
   随着智能化的发展,低成本、低功耗的硬件平台设备已经逐步成为人们智能化生活的重要需求之一。卷积神经网络(Convolution Neural Network,CNN)是一种很常见的神经网络结构,它的主要优势体现在图像的特征抽取方面。在FPGA上实现CNN具有高性能,可重配置,开发周期短等优势。然而,由于CNN模型中存在大量的浮点型参数以及较多的乘法运算,使得在FPGA上实现CNN不仅对FPGA提出了较高的存储要求,而且在推算的过程中需要大量的能耗。针对CNN本身在硬件实现的过程中存在的局限性,本文选择了裁剪的方法对CNN进行压缩,从而减小CNN中的参数量。为了避免常用的权重裁剪法会在FPGA上引入稀疏矩阵的问题,使用了卷积核裁剪法。对于固定数量的PE,卷积核裁剪法能够有效的减少需要进行并行计算的次数。在本文中提出了一种更为精确的衡量卷积核重要性的方式,使用对L_1范数和标准差进行加权求和的方式来计算每个卷积核的重要性,并对重要性较低的卷积核进行裁剪。本课题分别对VGG16以及ResNet18/34进行了实验,在几乎没有精度损失的前提条件下,在卷积层的裁剪率分别能够达到60%和40%。受到神经网络“不可解释性”的影响,神经网络的裁剪方法,多为基于“数学假设”的基础之上对神经网络中的权重或卷积核重要性进行计算。本文提出了通过最大化激活图对CNN进行可视化的方法对CNN进行裁剪,通过最大化激活图观察到了卷积核在训练任务中提取到的特征。在本文中使用图像熵的方法描述最大化激活图包含的信息量,并作为衡量卷积核重要性的标准。在进行实验的过程中,我们使用分层裁剪的方法对在CIFAR10上进行训练的VGG16网络进行了裁剪实验,并对实验结果进行了分析和讨论。为了验证算法的有效性,在本课题中使用HLS实现了一个VGG网络的变形,并查看了裁剪之前和裁剪之后网络所占用的资源,经过裁剪之后的网络能够将BRAM的占用率从203%降低为76%。通过Vivado进行功耗估算得出,经过裁剪之后的网络功耗节省了十倍。另外,裁剪之前的网络和裁剪之后的网络的精度差异不大,裁剪前的网络精度为83.04%,裁剪之后的网络精度为82.37%。
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.41;TN791;TP183
【部分图文】:

示意图,卷积核,示意图


图 3-1 CNN 卷积核裁剪示意图本章中采用了自适应多层裁剪法,该方法的主要流程是:对整个网络设置一个裁剪率,将网络中所有卷积核的重要性(本章中使用的重要性评价标准是对卷积核的 L1范数和标准差进行加权求和)放在一起比较,裁剪掉重要性较低的卷积核,然后对裁剪之后的网络进行微调,补偿在裁剪过程中损失的精度。对于 ResNet 而言,由于其结构较为复杂,残差块中的第一层可以使用前述方法直接进行裁剪,而残差块中的第二层的输出特征图由于需要与 shortcut上的输出特征图进行对应通道相加,因此不能随意的进行裁剪。如图 3-2 所示:ShortcutShortcut

衡量标准,L1范数,卷积核,加权求和


图 3-5 使用三种不同的衡量标准对 VGG16 进行裁剪的效果比较们主要对使用 L1范数与标准差进行加权求和的方式与 Li Hao 结果进行了比较,对于 VGG16 而言,当裁剪率大于 15%时,的方式作为衡量卷积核重要性的标准对网络进行裁剪,相比相用 L1范数做裁剪的网络,精度大约上升了 10%左右。

精度比较,L1范数,卷积核,衡量标准


图 3-5 使用三种不同的衡量标准对 VGG16 进行裁剪的效果比较们主要对使用 L1范数与标准差进行加权求和的方式与 Li Hao 结果进行了比较,对于 VGG16 而言,当裁剪率大于 15%时,的方式作为衡量卷积核重要性的标准对网络进行裁剪,相比相用 L1范数做裁剪的网络,精度大约上升了 10%左右。

【相似文献】

相关期刊论文 前10条

1 孔凡年;卷积核谱零点的剔除[J];电子科学学刊;1987年02期

2 姚若河;;时域卷积反演的一个新算法[J];桂林电子工业学院学报;1988年02期

3 沈辰;敬忠良;潘汉;;基于卷积核优化的运动图像盲去模糊算法[J];信息与控制;2014年01期

4 汪济洲;鲁昌华;查长军;;基于卷积核补偿ECG检测分类算法[J];自动化与仪器仪表;2009年04期

5 李妍;金士琪;多国帅;涂春蓉;戴旭;;迭代重建算法联合不同卷积核应用于冠脉双低扫描支架显示的比较研究[J];中国临床医学影像杂志;2019年02期

6 梅习龙;吴雄;蒋博;邓凯;颜敏;胡跃群;;第3代双源CT卷积核的选择对肺磨玻璃结节图像质量的影响[J];中南大学学报(医学版);2019年09期

7 劳保强;王俊义;王锦清;符杰林;仇洪冰;;基于卷积核网格化二维近程微波全息[J];微波学报;2014年05期

8 孙凤琪,多晓蜜;一类含卷积核的对偶型奇异积分方程的非正则型解法[J];松辽学刊(自然科学版);2001年04期

9 朱继洪;裴继红;赵阳;;卷积神经网络(CNN)训练中卷积核初始化方法研究[J];信号处理;2019年04期

10 张军阳;郭阳;扈啸;;二维矩阵卷积的并行计算方法[J];浙江大学学报(工学版);2018年03期

相关会议论文 前3条

1 李春鹏;郭杰;康学净;;基于DeepLab的二阶段人像分割方法[A];第十三届全国信号和智能信息处理与应用学术会议论文集[C];2019年

2 李盈达;鲁建壮;陈小文;;基于滚球模型的卷积神经网络数据复用方法及硬件实现[A];第二十二届计算机工程与工艺年会暨第八届微处理器技术论坛论文集[C];2018年

3 郝晓辰;杨跃;杨黎明;郭f萬

本文编号:2823865


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2823865.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b8a71***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com