灵长类动物面部教据集构建及识别方法研究
发布时间:2020-12-26 14:29
近年来,适用于不同研究任务的数据集不断涌现,规模不断增加,同时场景也越来越复杂。数据集的建立为科学研究的发展提供了数据基础,而数据集规模的增大、数据类型的多样化等也同时给现有的理论和方法提出了新的挑战,也因此使得新的具有更高性能的算法不断被提出。然而,目前国际上还没有应用于野生动物个体识别研究的大型数据集,已发布的个别动物数据集普遍存在数据量小、图片质量差等问题。这在很大程度上限制了目前动物面部识别算法的研究进展。目前,在动物个体识别领域,大多直接利用目标分类算法;而在利用动物面部信息进行个体识别研究方面,也基本是直接利用或稍加改进现有的人脸识别方法。然而,动物的面部结构、器官形状和面部纹理等诸多方面和人类存在着较大差异。因此,将现有的人脸识别算法直接应用于动物面部识别,其效果将大打折扣,然而,目前还未有专门针对动物面部识别问题提出相应的识别算法。针对上述问题,本文首先构建了首个大型灵长类面部数据集。在数据集建立的过程中,提出了一种快速有效的灵长类面部自动检测方法来获得源图像中的猴脸区域图像信息。接着,提出了一种改进的卷积神经网络(Convolutional Neural Networ...
【文章来源】:西北大学陕西省 211工程院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
具有一个隐含层的神经网络图2对应的公式为:
多层神经网络的训练方法本质上和 Logistic 回归模型相似,就需要运用链式求导法则对隐含层上的节点进行求导操作,在神经网络中称为反向传播。2.2.2 卷积神经网络卷积神经网络是对多层神经网络的进一步发展,在 CNN 中隐含层被赋予了卷积、采样、全连接三种不同的功能。图 3 是首个卷积神经网络 LeNet5 的结构图,从此,卷积+池化(下采样)+非线性激活的组合成为 CNN 的典型特征。在多层次的 CNN 中,图片经过输入层后往往会交替出现在卷积层和采样层,全连接层出现在最后,层数并不固定。接下来分别介绍它们的功能。西北大学硕士学位论文
视网膜输入层,第 m 层的接受域的宽度为 3,也就入层的 3 个相邻的神经元相连,第 m 层与第 m+1 层 m+1 层的神经元相对于第 m 层的接受域的宽度也为 5,这种结构将学习到的过滤器(对应于输入信号中间模式(因为每个单元对它接受域外的 variation 不个这样的层堆叠起来后,会使得过滤器(不再是线性了更大的视觉区域)。例如下图中第 m+1 层的神经元非线性的特征编码。西北大学硕士学位论文
【参考文献】:
期刊论文
[1]深度区域网络方法的细粒度图像分类[J]. 翁雨辰,田野,路敦民,李琼砚. 中国图象图形学报. 2017(11)
[2]自上而下注意图分割的细粒度图像分类[J]. 冯语姗,王子磊. 中国图象图形学报. 2016(09)
本文编号:2939878
【文章来源】:西北大学陕西省 211工程院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
具有一个隐含层的神经网络图2对应的公式为:
多层神经网络的训练方法本质上和 Logistic 回归模型相似,就需要运用链式求导法则对隐含层上的节点进行求导操作,在神经网络中称为反向传播。2.2.2 卷积神经网络卷积神经网络是对多层神经网络的进一步发展,在 CNN 中隐含层被赋予了卷积、采样、全连接三种不同的功能。图 3 是首个卷积神经网络 LeNet5 的结构图,从此,卷积+池化(下采样)+非线性激活的组合成为 CNN 的典型特征。在多层次的 CNN 中,图片经过输入层后往往会交替出现在卷积层和采样层,全连接层出现在最后,层数并不固定。接下来分别介绍它们的功能。西北大学硕士学位论文
视网膜输入层,第 m 层的接受域的宽度为 3,也就入层的 3 个相邻的神经元相连,第 m 层与第 m+1 层 m+1 层的神经元相对于第 m 层的接受域的宽度也为 5,这种结构将学习到的过滤器(对应于输入信号中间模式(因为每个单元对它接受域外的 variation 不个这样的层堆叠起来后,会使得过滤器(不再是线性了更大的视觉区域)。例如下图中第 m+1 层的神经元非线性的特征编码。西北大学硕士学位论文
【参考文献】:
期刊论文
[1]深度区域网络方法的细粒度图像分类[J]. 翁雨辰,田野,路敦民,李琼砚. 中国图象图形学报. 2017(11)
[2]自上而下注意图分割的细粒度图像分类[J]. 冯语姗,王子磊. 中国图象图形学报. 2016(09)
本文编号:2939878
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2939878.html