基于深度学习的金丝猴面部识别软件设计与实现
发布时间:2021-02-01 06:27
金丝猴是国家一级保护动物,在环境生态学和动物行为学研究方面具有重要的研究价值。在对金丝猴进行保护和相关研究的过程中,首要的任务就是准确识别金丝猴的个体身份。还需要对金丝猴个体的高级属性:性别和年龄段进行识别。针对目前相关部门已具有的大量金丝猴的图像和视频数据,而传统的人工识别的方法难易满足繁重的识别与分析任务,以及现有面部识别算法难以直接应用于猴脸特征识别的问题,本文展开基于深度学习的金丝猴面部识别算法的相关研究,快速准确的猴脸自动识别将很大程度上推进金丝猴研究与保护的工作进展。本文首先阐述了金丝猴面部图像识别的研究意义以及相关发展现状,然后概述了深度学习(Deep Learning,DL)以及卷积神经网络(Convolutional Neural Network,CNN)的相关理论基础,并分析了金丝猴面部图像相似性大,角度多变、存在部分遮挡等情况带来的识别难度,结合深度学习中卷积神经网络的基本方法和理论,设计了针对金丝猴个体识别以及性别和年龄段识别的网络结构,并给出了相应的识别算法。最后,设计并实现了基于Qt开源平台的金丝猴面部识别软件。(1)针对金丝猴个体识别任务中存在的难点,通过...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
带有一定角度的金丝猴面部图像
含了整个头部的区域,主要是由于脸上毛发的纹理特征是其比较关键的特征。而露出的皮肤区域占比相对较小,具体如图 3.6 所示。图3.6 金丝猴面部图像分析图从人类直观视觉的角度来说,对于金丝猴的个体识别,这部分整体占比较少的皮肤区域(包含眼睛、鼻子、嘴巴)对分类结果来说也比较重要。而当以整个面部图像作为卷积神经网络的输入时,随着多重的卷积和 pooling 操作,会使得这部分信息丢失的比较严重。多重卷积操作后会使得面部结构中的较为重要的几何位置之间的约束关系逐步消失,忽略掉其整体与局部之间的关联信息。因此,在金丝猴的个体面部图像识别任务中,如何兼顾面部的整体毛发以及占比相对较少又较为关键的面部皮肤区域就显得至关重要。
[41],如图 3.7 所示。图3.7 普通网络加深层数后错误率变化情况[41]图 3.7 中,左边是训练过程的错误率,右边是测试过程的错误率。可以看出,不论在训练过程还是测试过程中,这样简单的堆叠方式形成的网络,层数越来越深后准确率反而下降了。而 ResNet 则是提出了残差块结构来解决这个问题。ResNet 和HighWay Network[49]很相似,都允许原始输入信息直接传到后面的层中。具体来说,残差块与普通的网络在结构上的差别如图 3.8 所示。weight layerweight layerweight layerweight layerXH(x)XF(x)H(x)=F(x)+xrelurelurelurelu+图3.8 普通网络与残差网络结构对比图
【参考文献】:
期刊论文
[1]基于分块主成分分析的太行山猕猴面部相似性[J]. 王白石,王振龙,鹿鹤,李利,路纪琪. 兽类学报. 2013(03)
[2]走近蓝面精灵——川金丝猴[J]. 蔚培龙. 科学与文化. 2011(03)
[3]神农架川金丝猴栖息地植物区系特征及食物资源研究[J]. 铁军,张晶,彭林鹏,廖明尧,杨林森,张志翔. 广西植物. 2009(06)
[4]人脸检测研究综述[J]. 梁路宏,艾海舟,徐光祐,张钹. 计算机学报. 2002(05)
博士论文
[1]人脸识别中若干关键问题的研究[D]. 山世光.中国科学院研究生院(计算技术研究所) 2004
硕士论文
[1]基于CNN的金丝猴面部识别研究与实现[D]. 方楠.西安电子科技大学 2017
本文编号:3012335
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
带有一定角度的金丝猴面部图像
含了整个头部的区域,主要是由于脸上毛发的纹理特征是其比较关键的特征。而露出的皮肤区域占比相对较小,具体如图 3.6 所示。图3.6 金丝猴面部图像分析图从人类直观视觉的角度来说,对于金丝猴的个体识别,这部分整体占比较少的皮肤区域(包含眼睛、鼻子、嘴巴)对分类结果来说也比较重要。而当以整个面部图像作为卷积神经网络的输入时,随着多重的卷积和 pooling 操作,会使得这部分信息丢失的比较严重。多重卷积操作后会使得面部结构中的较为重要的几何位置之间的约束关系逐步消失,忽略掉其整体与局部之间的关联信息。因此,在金丝猴的个体面部图像识别任务中,如何兼顾面部的整体毛发以及占比相对较少又较为关键的面部皮肤区域就显得至关重要。
[41],如图 3.7 所示。图3.7 普通网络加深层数后错误率变化情况[41]图 3.7 中,左边是训练过程的错误率,右边是测试过程的错误率。可以看出,不论在训练过程还是测试过程中,这样简单的堆叠方式形成的网络,层数越来越深后准确率反而下降了。而 ResNet 则是提出了残差块结构来解决这个问题。ResNet 和HighWay Network[49]很相似,都允许原始输入信息直接传到后面的层中。具体来说,残差块与普通的网络在结构上的差别如图 3.8 所示。weight layerweight layerweight layerweight layerXH(x)XF(x)H(x)=F(x)+xrelurelurelurelu+图3.8 普通网络与残差网络结构对比图
【参考文献】:
期刊论文
[1]基于分块主成分分析的太行山猕猴面部相似性[J]. 王白石,王振龙,鹿鹤,李利,路纪琪. 兽类学报. 2013(03)
[2]走近蓝面精灵——川金丝猴[J]. 蔚培龙. 科学与文化. 2011(03)
[3]神农架川金丝猴栖息地植物区系特征及食物资源研究[J]. 铁军,张晶,彭林鹏,廖明尧,杨林森,张志翔. 广西植物. 2009(06)
[4]人脸检测研究综述[J]. 梁路宏,艾海舟,徐光祐,张钹. 计算机学报. 2002(05)
博士论文
[1]人脸识别中若干关键问题的研究[D]. 山世光.中国科学院研究生院(计算技术研究所) 2004
硕士论文
[1]基于CNN的金丝猴面部识别研究与实现[D]. 方楠.西安电子科技大学 2017
本文编号:3012335
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3012335.html