当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的脸耳多模态身份验证研究与系统设计

发布时间:2020-12-14 07:56
  随着人工智能技术的快速发展,生物特征识别技术在教育、医疗、军事、金融等各个领域得到广泛应用。尽管如此,在实际应用场合中,基于单一生物特征的生物特征识别系统常受到噪声干扰、非普遍性和抗哄骗能力差等诸多因素的制约,而利用多种生物特征信息的多模态生物特征识别系统可在一定程度上缓解单模态生物特征识别系统的部分缺陷,并且通过多模态生物特征融合显著提高系统识别性能。人脸识别采用非接触式图像采集,符合人类视觉识别习惯,并可隐蔽操作,应用场景和范围比指纹、虹膜识别等更加丰富和广泛。但人脸易受光照、姿态、表情、化妆和年龄等因素影响,人耳位于人脸附近,耳形状稳定,几乎不受表情和年龄的影响,结合人脸与人耳进行多模态识别,可提高系统的准确性和抗干扰能力,并增加可识别的角度范围。本文着重研究基于深度学习的人脸人耳检测技术和多模态融合识别,并设计和实现了一个基于脸耳多模态识别的考生签到系统。在人脸人耳检测方面,本文将头部图像划分和定义为人脸区域、人耳区域和头部区域,标注三类目标训练样本,采用Mask Scoring R-CNN检测技术框架进行训练和检测。由于人耳目标较小,训练样本有限,误检率较高。针对该问题,提出... 

【文章来源】:西华大学四川省

【文章页数】:75 页

【学位级别】:硕士

【部分图文】:

基于深度学习的脸耳多模态身份验证研究与系统设计


常见的用于生物特征识别的生物特征示例

流程图,流程图,主干网络,神经网络


西华大学硕士学位论文13图2.1MaskScoringR-CNN流程图Fig.2.1FlowchartofMaskScoringR-CNN2.1.1主干网络在目标检测中,特征提取至关重要,在MaskScoringR-CNN中主干网络(Backbonenetwork)一般选用深度卷积神经网络提取图像特征,现在卷积神经网络的发展趋势就是:足够深、足够广。足够深就是网络层数足够深,深层网络大多数情况下较浅层网络性能都会有足够的提升。足够广就意味着要从多尺度(Multi-Scale)的特征进行,多尺度可以很好地解决不同分辨率大小的目标。然而网络模型深度的加深,带来的不一定是性能的提升,梯度消失和网络退化随之而来,训练难度加大。为了处理上述问题,训练网络时加速收敛,引入了残差神经网络(ResNet)。图2.2是ResNet的18层网络的结构示意图。

网络结构图,金字塔,自上而下,侧向


基于深度学习的脸耳多模态身份验证研究与系统设计16公式(2.1)所示。H)()x(xxF(2.1)除此之外,残差网络关注特征矩阵维度的变化,残差网络利用11卷积和BatchNormalization层没有增加新的学习参数的情况下,加速训练过程中网络的收敛。2.1.2特征金字塔(FPN)多尺度问题常用的解决方案就是构造多尺度金字塔。特征金字塔网络(FPN)是2017年由Facebook提出的用于多尺度检测的算法[50],通过自上而下和自上而下的网络连接方式,计算量没有明显的增加,实时性基本不受影响,大幅提升对小尺度目标的检测性能。由此本文采用的MaskScoringR-CNN中引入了多尺度的特征金字塔网络(FeaturePyramidNetwork,FPN),网络可以分为由自下而上和自上而下两条通道侧向连接,如图2.3所示。图2.3特征金字塔网络结构图Fig.2.3StructurechartofFeaturizedPyramidNetwork(1)自下而上(Bottom-up)的过程就是卷积神经网络的正向传播过程,将处理后的图片送入特征网络经过卷积运算后,随着层数的增多,空间分辨率减少,从图像中挖掘到更多的语义信息。(2)自上而下(Top-down)和侧向连接的过程是得到的深层特征图通过上采样操作一步步还原回去,保留特征图的语义信息,同时增大了特征图的尺寸。通过侧向连接将自下而上和自上而下的通道进行侧向连接,侧向连接的时候按照逐元素相加的规则进


本文编号:2916103

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2916103.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户27580***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com