基于深度神经网络的人脸识别方法研究
发布时间:2020-12-05 06:45
伴随人工智能和深度学习的日益壮大,人脸识别逐渐地在多个行业和领域得到扩张。基于卷积神经网络的人脸识别技术被广泛地应用于安防、商业、金融、娱乐领域;与传统人脸识别方法相比,既能够自动提取图像特征,其模型还可以自动学习而得到较高的识别率。该方法根据训练数据集大小来设计适合的网络结构,其中最核心的技术是对超参数的调试。本文对AlexNet网络结构进行改进和优化,提高训练效率和稳定性。主要研究内容如下:(1)卷积神经网络是一种深层次并且稀疏的传统人工神经网络。从而本文首先分析了传统人工神经网络的模型结构、前向和反向传播算法;然后对其卷积层、激励层、池化层和全连接层进行阐述;再用数学公式对其正向传播、反向传播过程进行了推导;接着对其训练过程进行了说明;最后简要介绍梯度下降算法。(2)人脸图像的预处理包括人脸图像检测、人脸图像裁剪、人脸图像标准化、分类标记、转换数据、作训练集平均值文件等,并基于机器视觉库OpenCV的特征脸、线性判别分析、局部二值模式直方图等人脸识别的算法进行了实现。(3)对AlexNet网络在人脸识别中存在的损失梯度下降的慢,识别率梯度上升的慢,稳定性差的问题,提出了基于改进和...
【文章来源】:沈阳工业大学辽宁省
【文章页数】:87 页
【学位级别】:硕士
【部分图文】:
ReLu函数Fig.2.5ReLufunction
第 3 章 基于深度网络的人脸识别方法首先对人脸数据集简要剖析。然后对 OpenCV 中的人脸识别算 AlexNet 网络结构分析和改进,以减少参数数量,降低对 GP最后,对改进结构进行深度学习,分析其在人脸识别领域的应佳的训练模型。数据集用到的人脸数据库包括 ORL、GT、Essex(Faces95)等。)ORL 数据集:共有 40 个不同年龄、不同性别和不同种族的0 副灰度图像,共计 400 副灰度图像,图像尺寸是 92*112 像素变化,如笑与不笑、眼睛睁与不睁、眼镜戴与不戴等,是目前准数据库。如图 3.1 所示是 ORL 人脸数据库的样例。
0 副灰度图像,共计 400 副灰度图像,图像尺寸是 92*112 像素变化,如笑与不笑、眼睛睁与不睁、眼镜戴与不戴等,是目前准数据库。如图 3.1 所示是 ORL 人脸数据库的样例。图 3.1 ORL 人脸数据库样例Fig. 3.1 ORL face database sample)GT 数据集:包含 50 个人,每人 15 张不同角度、不同表情的 640*480,特点是数据量比较多,每个人的图像信息丰富多变T 人脸数据库的样例。
本文编号:2899059
【文章来源】:沈阳工业大学辽宁省
【文章页数】:87 页
【学位级别】:硕士
【部分图文】:
ReLu函数Fig.2.5ReLufunction
第 3 章 基于深度网络的人脸识别方法首先对人脸数据集简要剖析。然后对 OpenCV 中的人脸识别算 AlexNet 网络结构分析和改进,以减少参数数量,降低对 GP最后,对改进结构进行深度学习,分析其在人脸识别领域的应佳的训练模型。数据集用到的人脸数据库包括 ORL、GT、Essex(Faces95)等。)ORL 数据集:共有 40 个不同年龄、不同性别和不同种族的0 副灰度图像,共计 400 副灰度图像,图像尺寸是 92*112 像素变化,如笑与不笑、眼睛睁与不睁、眼镜戴与不戴等,是目前准数据库。如图 3.1 所示是 ORL 人脸数据库的样例。
0 副灰度图像,共计 400 副灰度图像,图像尺寸是 92*112 像素变化,如笑与不笑、眼睛睁与不睁、眼镜戴与不戴等,是目前准数据库。如图 3.1 所示是 ORL 人脸数据库的样例。图 3.1 ORL 人脸数据库样例Fig. 3.1 ORL face database sample)GT 数据集:包含 50 个人,每人 15 张不同角度、不同表情的 640*480,特点是数据量比较多,每个人的图像信息丰富多变T 人脸数据库的样例。
本文编号:2899059
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2899059.html