基于联合编码和卷积网络的人脸图像特征提取方法研究
发布时间:2020-08-13 18:55
【摘要】:人脸识别是图像处理和计算机视觉领域的一个研究热点,经过几十年的发展,取得了令人瞩目的进展,但是人脸识别依然是一个具有挑战性的研究课题,因为图像在拍摄过程受姿态、光照、遮挡等因素的影响,导致同类样本的相似度减小、异类样本的相似度提升。经典的人脸识别系统主要包括检测、对齐、特征提取和识别四个部分,其中特征提取对整个识别系统的性能起着至关重要的作用。本文以人脸识别为应用背景,以提升人脸特征的鲁棒性与判别性为研究目标,从手工设计、浅层学习和深层学习三个层面分别提出了三种人脸特征提取方法。本文主要研究工作和创新点如下:(1)在手工设计特征层面,提出多方向局部线形模式联合编码(Joint Encoding of Multi-Direction Line Binary Patterns,JEMDLBP)。该方法包含三个核心部分:局部方向线形模式(Direction Line Binary Patterns,DLBP)、显著模式统计、多方向联合编码。不同于LBP在局部方形空间编码,DLBP在局部线形空间编码;显著模式统计可以在不同数据库、不同方向自适应地提取显著DLBP模式;多方向联合编码能够捕捉多个方向DLBP模式之间的共生信息,从而提高特征的判别能力。在四个人脸识别数据库和一个人脸表情识别数据库上的实验结果表明JEMDLBP特征优于传统的局部二值模式类特征。(2)在浅层学习特征层面,提出判别概率潜在语义分析模型(Discriminative probabilistic Latent Semantic Analysis,DpLSA),把传统人脸特征提取问题转化为文档主题分析问题进行解决,为人脸特征提取提供全新的思路。针对基于主题模型p LSA的人脸识别算法所学特征P(z|d)(主题-图像分布)缺乏明确意义的不足,本文提出的DpLSA模型利用每类训练样本的结构信息,给出一个新颖的单词-主题分布初始化方法,在主题和图像类别之间建立一一对应关系,解决了传统主题模型中如何选择合适主题个数的问题、解决了EM算法对模型初始化的敏感问题、加快了模型的训练速度,更为重要的是Dp LSA学到的人脸图像特征P(z|d)具有判别语义性,可以直接用于识别任务。在多个人脸数据库上的实验结果表明DpLSA对光照、遮挡和姿态具有较好的鲁棒性。(3)在深层学习特征层面,提出级联K-means卷积特征学习方法(Cascaded K-means Convolutional Feature Learning,CKCFL),该方法延用卷积神经网络的特征提取思想,采用轻量级深度神经网络框架,在性能与效率两方面提供良好的折中。CKCFL对深度神经网络的三个核心模块:滤波器学习、特征变换和池化进行深入研究。在卷积滤波器学习层,CKCFL将K-means算法用于加速卷积滤波器的学习;在非线性变换层,利用激励函数进行非线性特征变换,实验发现Tanh函数的性能优于其他激励函数;在特征池化层采用空间金字塔二阶池化,一方面能够刻画不同维度特征之间的相关性,克服传统一阶池化只统计每个维度特征之间信息的不足,另一方面可以同时提取局部特征和整体特征。本文详细探讨了CKCFL的不同参数和模块对识别率的影响,在AR、Extended Yale B、FERET和LFW等受限和非受限人脸数据库上的实验结果证明了CKCFL特征的判别性和鲁棒性。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP391.41;TP183
【图文】:
(a) 图 2.6 (a) 深度信念网Fig. 2.6 (a) Deep Brief N2.4.2 卷积神经网络卷积神经网络是 LeCun 等人[123]在于手写数字识别,图 2.7 显示了两阶段① 局部感知野:由于图像相邻像部感知野来捕捉像素间相关信息,即接;逐层传递到深层,网络可以学习② 权值共享:为了避免全链接方了权值共享策略,每一层的所有神经取图像的一类特征,则多种卷积滤波于两方面,一方面减少模型参数、加速③ 特征池化层:采用池化层可以
本文编号:2792385
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP391.41;TP183
【图文】:
(a) 图 2.6 (a) 深度信念网Fig. 2.6 (a) Deep Brief N2.4.2 卷积神经网络卷积神经网络是 LeCun 等人[123]在于手写数字识别,图 2.7 显示了两阶段① 局部感知野:由于图像相邻像部感知野来捕捉像素间相关信息,即接;逐层传递到深层,网络可以学习② 权值共享:为了避免全链接方了权值共享策略,每一层的所有神经取图像的一类特征,则多种卷积滤波于两方面,一方面减少模型参数、加速③ 特征池化层:采用池化层可以
【参考文献】
相关期刊论文 前1条
1 江悦;王润生;王程;;采用上下文金字塔特征的场景分类[J];计算机辅助设计与图形学学报;2010年08期
相关博士学位论文 前4条
1 鄢萌;软件仓库的主题挖掘及其在软件维护中的应用研究[D];重庆大学;2017年
2 苏煜;融合全局和局部特征的人脸识别[D];哈尔滨工业大学;2009年
3 邓伟洪;高精度人脸识别算法研究[D];北京邮电大学;2009年
4 山世光;人脸识别中若干关键问题的研究[D];中国科学院研究生院(计算技术研究所);2004年
本文编号:2792385
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2792385.html