基于深度卷积神经网络的人脸图像分类应用研究
发布时间:2021-01-28 18:37
在人脸图像分类识别领域,相较于传统的机器学习法而言,卷积神经网络(Convolutional Neural Network,CNN)能够更好地自主捕获图像中的潜在特征,替代了以往需要人工进行捕获的手段,进而取得了广泛的应用。尤其是在2012年出现Alex Net神经网络之后,深度CNN为图像领域带来了深刻的变革,它可以提取到更深层次的抽象特征,这会帮助它极大地提升模型的分类、识别的准确率。但是,这同样也会带来一些问题,主要的缺点在于它会使得参数量变得巨大,训练非常耗时。如今完善的建模理论还没有面世,关于网络结构的进一步优化也有待于解决,并且笔者发现网络训练过程中采用的算法有着明显的局限性,这些都会对网络模型产生影响。本文将就CNN模型结构展开探索,希望能够对该模型的训练过程进行优化,从而实现高效CNN模型的构建,并将该模型迁移学习到新的应用场景中。具体的研究内容如下:(1)本文首先分析研究了VGGNet网络模型的结构和参数,选取了最为常用且高效的VGG-16作为改进模型的原型。在VGG-16卷积部分的最后加入多尺度采样层(Multi-scale Sampling Layer),使得模型...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
LeNet-5卷积神经网络
神经元在整个网络系统中处于基层,是构建一个网络系统的最基础部分,通常它是一个能够实现多个输入而单个输出的结构,其结构表示如图 2.1 所示。图2.1 神经元模型其中,xi代表神经元的输入;{x1,x2,。。。xn}表示有 n 个数据输入进了神经元 j;ωij表示输入信号 xi与神经元 j 连接的权值;bi表示内部状态的偏置值,yi为神经元的输出,可以用一个非线性模型的表达式(2-1)来表示这个连接:(2-1)(())1 niiiiijy fbx
一般比单层神经元的结构复杂,隐含层和输出端数量都相对较多,可以解决线性不可分的问题,如图 2.2 所示为一种类型的多层感知器结构:图2.2 多层感知器结构图输入层神经元负责接受来自外界的相关信号,第 1 隐含层与其对应的输入层相互连接,同一层神经元之间不连接,最后一层隐含层神经元与输出层神经元全接连。图2-2 中,箭头所指的方向表示的是各单元连接和输出的方向,不同的连接处分别对应
【参考文献】:
期刊论文
[1]混合PSO优化卷积神经网络结构和参数[J]. 唐贤伦,刘庆,张娜,周家林. 电子科技大学学报. 2018(02)
[2]基于深度卷积神经网络的人脸识别技术综述[J]. 景晨凯,宋涛,庄雷,刘刚,王乐,刘凯伦. 计算机应用与软件. 2018(01)
[3]基于数据源分析的数据增强方法[J]. 彭琮,曹建军,吴凡,温俊. 兵工自动化. 2017(12)
[4]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 王琳,赵耀,余静华,陈曦. 农村经济与科技. 2017(14)
[5]多任务学习及卷积神经网络在人脸识别中的应用[J]. 邵蔚元,郭跃飞. 计算机工程与应用. 2016(13)
[6]迁移学习研究进展[J]. 庄福振,罗平,何清,史忠植. 软件学报. 2015(01)
[7]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟. 计算机研究与发展. 2013(09)
[8]粒子群优化算法综述[J]. 杨维,李歧强. 中国工程科学. 2004(05)
硕士论文
[1]基于卷积神经网络的人脸性别识别研究[D]. 裴子龙.山西师范大学 2017
[2]基于卷积神经网络的视觉识别研究[D]. 薛昆南.华南农业大学 2016
[3]基于粒子群算法的LeNet-5卷积神经网络优化研究[D]. 向展.华中科技大学 2016
本文编号:3005481
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
LeNet-5卷积神经网络
神经元在整个网络系统中处于基层,是构建一个网络系统的最基础部分,通常它是一个能够实现多个输入而单个输出的结构,其结构表示如图 2.1 所示。图2.1 神经元模型其中,xi代表神经元的输入;{x1,x2,。。。xn}表示有 n 个数据输入进了神经元 j;ωij表示输入信号 xi与神经元 j 连接的权值;bi表示内部状态的偏置值,yi为神经元的输出,可以用一个非线性模型的表达式(2-1)来表示这个连接:(2-1)(())1 niiiiijy fbx
一般比单层神经元的结构复杂,隐含层和输出端数量都相对较多,可以解决线性不可分的问题,如图 2.2 所示为一种类型的多层感知器结构:图2.2 多层感知器结构图输入层神经元负责接受来自外界的相关信号,第 1 隐含层与其对应的输入层相互连接,同一层神经元之间不连接,最后一层隐含层神经元与输出层神经元全接连。图2-2 中,箭头所指的方向表示的是各单元连接和输出的方向,不同的连接处分别对应
【参考文献】:
期刊论文
[1]混合PSO优化卷积神经网络结构和参数[J]. 唐贤伦,刘庆,张娜,周家林. 电子科技大学学报. 2018(02)
[2]基于深度卷积神经网络的人脸识别技术综述[J]. 景晨凯,宋涛,庄雷,刘刚,王乐,刘凯伦. 计算机应用与软件. 2018(01)
[3]基于数据源分析的数据增强方法[J]. 彭琮,曹建军,吴凡,温俊. 兵工自动化. 2017(12)
[4]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 王琳,赵耀,余静华,陈曦. 农村经济与科技. 2017(14)
[5]多任务学习及卷积神经网络在人脸识别中的应用[J]. 邵蔚元,郭跃飞. 计算机工程与应用. 2016(13)
[6]迁移学习研究进展[J]. 庄福振,罗平,何清,史忠植. 软件学报. 2015(01)
[7]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟. 计算机研究与发展. 2013(09)
[8]粒子群优化算法综述[J]. 杨维,李歧强. 中国工程科学. 2004(05)
硕士论文
[1]基于卷积神经网络的人脸性别识别研究[D]. 裴子龙.山西师范大学 2017
[2]基于卷积神经网络的视觉识别研究[D]. 薛昆南.华南农业大学 2016
[3]基于粒子群算法的LeNet-5卷积神经网络优化研究[D]. 向展.华中科技大学 2016
本文编号:3005481
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3005481.html