基于8bit量化神经网络的人脸检测识别算法设计与FPGA验证
发布时间:2021-01-10 21:02
人脸检测识别技术操作友好用途广泛,已经成为社会生活中最重要的生物特征识别技术之一,基于深度卷积神经网络的人脸检测识别方法相较传统方法拥有更好的准确性和可扩展性,但其存储、传输与计算的成本也更高。使用数值量化方法可以降低深度卷积神经网络的运行成本,配合针对优化的硬件设计,能在有限的资源下实现较高的处理速度,若能在量化的同时保持检测识别的准确性,即有望实现高效的终端人脸检测识别系统,为智慧城市、智能物联网等下一代应用场景补上技术上的关键一环。本文首先总结了人脸检测、人脸识别、神经网络量化与硬件加速的代表性方法。然后,优化DoReFa-Net算法改变量化数据分布形式,提高量化模型的存储空间利用率,经测试,在8-bit量化精度下,可保持模型准确率且获得较高的压缩率和加速效果。基于YOLO算法设计端到端的8-bit量化人脸检测网络,在提升检测速度的同时也能取得较高的准确率。基于CenterFace算法设计低类内距离高类间距离的8-bit量化人脸识别网络,使误识更少,识别类别可扩展性更强。在此基础上,通过多层次的并行计算扩展和数据复用优化,实现了低带宽需求、高吞吐率以及高资源利用率的通用卷积神经网...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:117 页
【学位级别】:硕士
【部分图文】:
空间金字塔池化示意图
调参优化。目前为止YOLO先后推出了v1、v2和v3三个版本,每一版都在前作的基础上做了升级优化。本节将对YOLO的设计理念、相关结构以及关键环节进行说明,在第三章将介绍如何将其用于人脸检测。2.3.1设计理念YOLO[15]的全称是YouOnlyLookOnce,意思是这个网络工作时“只需看一遍”——整张图片经过一次网络评估便能得到相关对象的预测位置和类别,这得益于YOLO将此前目标检测环节的各个组件统一到单个神经网络。如图2-18所示,YOLO处理图像只需要三步:图像调整、卷积神经网络运算、多余(低置信度、重叠)预测框去除。图2-18YOLO图像处理流程[17]图像调整的目的是将输入图片规格化为网络的输入尺寸,虽然对于全卷积神经网络(不包含全连阶层)而言这一步不是必需的,但合理的输入尺寸对控制计算量也很有帮助。卷积神经网络是YOLO的灵魂核心,网络的输入是整张图片,网络的输出特征向量是预测的边界框位置、含有检测目标的置信度以及目标类别,网络进行的是“端到端(endtoend)”的学习。为了避免输出特征向量之间发生竞争或位置出现过大漂移,YOLO引入了网格(gridcell)的概念,输出特征向量中的某组预测值只负责检测以该组对应网格为中心的目标,如图2-19所示。
东南大学工程硕士学位论文30图2-19YOLO中基于网格的检测框预测与类别评分机制[17]网络的输出是定长的特征向量,由固定数量(几百或几千)的预测框信息组成。大部分预测框内不包含目标物体,其对应的置信度值很小,可以通过设定的置信度阈值直接筛掉;有一部分预测框包含的是同一个目标物体,使用非极大值抑制(Non-MaximumSuppression,NMS)方法保留其中置信度最高的一个。2.3.2网络结构高效的算法搭配合适的基础骨干(backbone)网络,才能充分发挥出深度学习方法的性能。YOLO的基础网络结构几经更迭,多次引入先进的网络设计思想,使网络的速度和准确率都取得了稳步提升。YOLOv1使用的基础网络参考了GoogLeNet的结构,采用1×1的卷积核压缩通道,7×7和3×3的卷积核提取特征,整个网络由24个卷积层、4个最大池化层以及2个全连接层组成,如图2-20所示,括号内为卷积/全连接层的核类型,如[7×7×64,s=2]代表卷积核尺寸为7×7,输出通道64,步长为2,默认步长为1。文中还提出了FastYOLO,这是YOLO的一个轻量级网络结构版本,其中采用了9个卷积层,每层通道也做了削减,从而使计算量大幅降低,在结果精度上稍有损失,但处理速度提升了数倍。卷积层最大池化1层层[7×7×64,s=2]卷积层最大池化1层层[3×3×192]卷积层最大池化4层层[1×1×128][3×3×256][1×1×256][3×3×512]卷积层最大池化10层层[1×1×256][3×3×512][1×1×512][3×3×1024]卷积层8层[1×1×512][3×3×1024][3×3×1024][3×3×1024,s=2]全连接层2层[1024×4096][4096×30][3×3×1024][3×3×1024]输入输出×4×2图2-20YOLOv1网络结构
【参考文献】:
期刊论文
[1]ASM姿态矫正结合字典学习优化的人脸识别[J]. 钟小莉. 计算机工程与设计. 2018(11)
[2]基于深度残差网络的行人人脸识别算法研究[J]. 易锋,胡馨莹. 电脑知识与技术. 2018(23)
[3]基于区域特征的快速人脸检测法[J]. 卢春雨,张长水,闻芳,阎平凡. 清华大学学报(自然科学版). 1999(01)
博士论文
[1]基于深度学习的暴力检测及人脸识别方法研究[D]. 丁春辉.中国科学技术大学 2017
硕士论文
[1]基于人脸检测YOLO算法的专用型卷积神经网络推理加速器的研究与设计[D]. 罗聪.华南理工大学 2018
[2]基于HLS的Tiny-yolo卷积神经网络加速研究[D]. 张丽丽.重庆大学 2017
本文编号:2969406
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:117 页
【学位级别】:硕士
【部分图文】:
空间金字塔池化示意图
调参优化。目前为止YOLO先后推出了v1、v2和v3三个版本,每一版都在前作的基础上做了升级优化。本节将对YOLO的设计理念、相关结构以及关键环节进行说明,在第三章将介绍如何将其用于人脸检测。2.3.1设计理念YOLO[15]的全称是YouOnlyLookOnce,意思是这个网络工作时“只需看一遍”——整张图片经过一次网络评估便能得到相关对象的预测位置和类别,这得益于YOLO将此前目标检测环节的各个组件统一到单个神经网络。如图2-18所示,YOLO处理图像只需要三步:图像调整、卷积神经网络运算、多余(低置信度、重叠)预测框去除。图2-18YOLO图像处理流程[17]图像调整的目的是将输入图片规格化为网络的输入尺寸,虽然对于全卷积神经网络(不包含全连阶层)而言这一步不是必需的,但合理的输入尺寸对控制计算量也很有帮助。卷积神经网络是YOLO的灵魂核心,网络的输入是整张图片,网络的输出特征向量是预测的边界框位置、含有检测目标的置信度以及目标类别,网络进行的是“端到端(endtoend)”的学习。为了避免输出特征向量之间发生竞争或位置出现过大漂移,YOLO引入了网格(gridcell)的概念,输出特征向量中的某组预测值只负责检测以该组对应网格为中心的目标,如图2-19所示。
东南大学工程硕士学位论文30图2-19YOLO中基于网格的检测框预测与类别评分机制[17]网络的输出是定长的特征向量,由固定数量(几百或几千)的预测框信息组成。大部分预测框内不包含目标物体,其对应的置信度值很小,可以通过设定的置信度阈值直接筛掉;有一部分预测框包含的是同一个目标物体,使用非极大值抑制(Non-MaximumSuppression,NMS)方法保留其中置信度最高的一个。2.3.2网络结构高效的算法搭配合适的基础骨干(backbone)网络,才能充分发挥出深度学习方法的性能。YOLO的基础网络结构几经更迭,多次引入先进的网络设计思想,使网络的速度和准确率都取得了稳步提升。YOLOv1使用的基础网络参考了GoogLeNet的结构,采用1×1的卷积核压缩通道,7×7和3×3的卷积核提取特征,整个网络由24个卷积层、4个最大池化层以及2个全连接层组成,如图2-20所示,括号内为卷积/全连接层的核类型,如[7×7×64,s=2]代表卷积核尺寸为7×7,输出通道64,步长为2,默认步长为1。文中还提出了FastYOLO,这是YOLO的一个轻量级网络结构版本,其中采用了9个卷积层,每层通道也做了削减,从而使计算量大幅降低,在结果精度上稍有损失,但处理速度提升了数倍。卷积层最大池化1层层[7×7×64,s=2]卷积层最大池化1层层[3×3×192]卷积层最大池化4层层[1×1×128][3×3×256][1×1×256][3×3×512]卷积层最大池化10层层[1×1×256][3×3×512][1×1×512][3×3×1024]卷积层8层[1×1×512][3×3×1024][3×3×1024][3×3×1024,s=2]全连接层2层[1024×4096][4096×30][3×3×1024][3×3×1024]输入输出×4×2图2-20YOLOv1网络结构
【参考文献】:
期刊论文
[1]ASM姿态矫正结合字典学习优化的人脸识别[J]. 钟小莉. 计算机工程与设计. 2018(11)
[2]基于深度残差网络的行人人脸识别算法研究[J]. 易锋,胡馨莹. 电脑知识与技术. 2018(23)
[3]基于区域特征的快速人脸检测法[J]. 卢春雨,张长水,闻芳,阎平凡. 清华大学学报(自然科学版). 1999(01)
博士论文
[1]基于深度学习的暴力检测及人脸识别方法研究[D]. 丁春辉.中国科学技术大学 2017
硕士论文
[1]基于人脸检测YOLO算法的专用型卷积神经网络推理加速器的研究与设计[D]. 罗聪.华南理工大学 2018
[2]基于HLS的Tiny-yolo卷积神经网络加速研究[D]. 张丽丽.重庆大学 2017
本文编号:2969406
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2969406.html
最近更新
教材专著