改进级联卷积神经网络的平面旋转人脸检测与识别
发布时间:2023-02-26 01:55
本论文首先针对多样的平面内旋转(Rotation in Plane,RIP)角度下的人脸检测这一难点,提出了一种基于改进型级联卷积神经网络的人脸检测算法,实验证明,该算法可以较精确的检测任意平面旋转角度下的人脸;然后结合Facenet网络和XGBoost分类器,对RIP角度下所检测到的人脸图片进行识别,实验表明,本文所提出方法对于RIP角度下的人脸识别具有较高的准确率。论文的主要工作内容包括:1、本文改进了MTCNN级联卷积神经网络,MTCNN网络共三级分别为12net,24net,48net。改进前的级联卷积神经网络只能检测普通场景下旋转角度很小的人脸,通过在该级联神经网络的第一级(12net)和第三级(48net)之间嵌入一个分类网络(Cnet)进行RIP角度判断,和改进前的第二级网络(24net)组成一个并联结构。Cnet是一个较小的卷积神经网络,由3个卷积层两个全连接层组成,在每个卷积层后都加入了BN层和池化层,Cnet通过交叉熵损失函数输出四个类别,平面旋转人脸图片按照垂直方向上每90°划分为一类。测试时,12net输出的人脸候选框通过Cnet分类,再经过仿射变换后输入到48...
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.1.1 人脸检测和识别研究进展
1.1.2 平面旋转人脸检测研究现状及分析
1.2 论文算法框图
1.3 论文组织
第二章 卷积神经网络的实践
2.1 卷积神经网络
2.1.1 前向传播
2.1.2 优化方法
2.2 视觉任务
2.2.1 分类
2.2.2 回归
2.3 非极大值抑制
2.4 交并比
2.5 本章小结
第三章 平面旋转人脸检测及关键点定位
3.1 级联卷积神经网络
3.1.1 12net
3.1.2 24net
3.1.3 48net
3.1.4 网络框架
3.2 改进级联卷积神经网络
3.2.1 分类网络
3.2.2 整体结构
3.3 多任务学习
3.3.1 人脸分类
3.3.2 人脸边界框回归
3.3.3 人脸关键点定位
3.3.4 多任务损失
3.4 本章小结
第四章 人脸识别算法
4.1 人脸特征提取
4.2 人脸分类器
4.2.1 XGBoost
4.3 本章小结
第五章 实验与分析
5.1 训练过程
5.2 FDDB人脸数据集评估
5.3 评估平面旋转人脸
5.4 人脸检测运行效率
5.5 人脸识别效果
5.5.1 RIP人脸识别
5.6 本章小结
总结与展望
参考文献
攻读硕士学位期间所取得学术成果
致谢
本文编号:3749574
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.1.1 人脸检测和识别研究进展
1.1.2 平面旋转人脸检测研究现状及分析
1.2 论文算法框图
1.3 论文组织
第二章 卷积神经网络的实践
2.1 卷积神经网络
2.1.1 前向传播
2.1.2 优化方法
2.2 视觉任务
2.2.1 分类
2.2.2 回归
2.3 非极大值抑制
2.4 交并比
2.5 本章小结
第三章 平面旋转人脸检测及关键点定位
3.1 级联卷积神经网络
3.1.1 12net
3.1.2 24net
3.1.3 48net
3.1.4 网络框架
3.2 改进级联卷积神经网络
3.2.1 分类网络
3.2.2 整体结构
3.3 多任务学习
3.3.1 人脸分类
3.3.2 人脸边界框回归
3.3.3 人脸关键点定位
3.3.4 多任务损失
3.4 本章小结
第四章 人脸识别算法
4.1 人脸特征提取
4.2 人脸分类器
4.2.1 XGBoost
4.3 本章小结
第五章 实验与分析
5.1 训练过程
5.2 FDDB人脸数据集评估
5.3 评估平面旋转人脸
5.4 人脸检测运行效率
5.5 人脸识别效果
5.5.1 RIP人脸识别
5.6 本章小结
总结与展望
参考文献
攻读硕士学位期间所取得学术成果
致谢
本文编号:3749574
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3749574.html