基于神经网络的人脸识别算法研究

发布时间：2020-11-12 08:59

　　随着社会科技的不断进步与发展,以人脸识别为代表的相关技术逐渐成为图像分类识别中的重要研究领域。基于传统方法的人脸识别技术,识别精度不高,实现过程较为复杂,并且光照、姿态、表情以及遮挡等的因素都会影响到人脸特征提取,算法的鲁棒性比较差,因此无法满足实际应用的需求。而基于卷积神经网络的算法可以更高效地提取深层次的人脸特征,有效地解决了传统技术所面临的许多问题,使得基于卷积神经网络的技术成为人脸识别的主要方式。本文在调研了许多关于人脸识别技术的文献与参考资料的基础上,主要进行了以下几个方面的工作:首先,对卷积神经网络的思想和结构进行了深入分析,介绍了网络中各层的计算方式以及相关算法。对激活函数和dropout等神经网络中常用的关键技术进行了阐述,作为后面章节的理论部分。然后,以LeNet-5网络结构模型为基础,研究了基于浅层神经网络的人脸识别算法。通过以下四个方面对其进行改进和优化:首先改进网络结构和深度,使其可以提取到更深层次、更多样的人脸特征;其次改用relu激活函数,最大化地保留数据特征,使神经网络在迭代运算的过程中可以得到又快又好的结果;然后采用交叉熵损失函数对网络模型的参数不断进行训练;最后添加dropout技术层,防止模型过拟合,在一定程度上优化模型的泛化能力。最终构建生成了一个新的网络模型CLeNet,CLeNet网络模型具有更深层次的结构和更多的训练参数,在ORL以及AR人脸数据集上的实验结果表明,CLeNet网络模型进一步提高了网络模型的精确度,从而证明了改进的可行性。最后,以VGGNet网络模型为基础,研究了基于深层神经网络的人脸识别算法。通过以下四个方面对其进行改进:首先减少一层全连接层,以便减少计算参数,提高训练效率;其次加入BN层,防止梯度消失,加快网络模型的收敛速度;然后使用步长为2的卷积层代替池化层,使网络模型可以学习到更好的非线性表达能力;最后在此基础上引入残差块,最终生成RVGGNet网络模型。RVGGNet网络模型不仅能避免梯度消失的问题,而且还解决了网络层数的加深带来的识别精度不高的问题,在相关数据集上的实验结果表明,RVGGNet网络模型可以达到更好的识别精度,由此验证了该改进方法的可行性。
【学位单位】：江西财经大学
【学位级别】：硕士
【学位年份】：2020
【中图分类】：TP183;TP391.41
【部分图文】：

函数曲线图,函数,激活函数,卷积

3基于浅层卷积神经网络的人脸识别研究25由此可知，通过以上卷积层结构的安排可以使得卷积层对输入图像进行更加密集的操作，从而可以提取到更加详细、多样的特征，使该网络模型具有更好地提取关键特征的能力。3.2.2激活函数选取sigmoid函数以及tanh函数是在神经网络训练的过程中较为常用的激活函数。这类函数主要是为神经网络模型添加非线性计算方式，防止饱和问题的发生。sigmoid的表达式如式(3-2)所示，曲线图如图3.2所示。()=11+(3-2)图3.2sigmoid函数曲线图如图3.2所示，我们可以看出的取值范围是(∞,+∞)，然而对应的的取值范围为(0,1)，也就是说sigmoid函数能够把输入的值都压缩到01的区间中。但是当变量逐渐趋近正负无穷大时，对应的值也会逐渐接近1或1，这样的情况就称之为饱和。而处于饱和状态的激活函数会丢失信息[52]，这是因为当的取值处于函数的边缘两侧时，的输出信息会大致相同。所以为了有效地使用sigmiod函数，最好将取值范围固定在-3到3之间。早期较常用的激活函数还有tanh函数。tanh函数虽然是sigmoid函数的升级优化版，它将sigmoid函数的0到1之间的输出值升级到1到1之间。但是在某些输出需要大于0的情况，仍然是需要使用sigmoid函数进行激活，因此tanh函数是不能完全替代sigmoid函数的[53]。tanh的数学表达式如式(3-3)所示。函数曲线图如图3.3所示。()=+(3-3)

函数曲线图,函数,激活函数,反向传播

基于神经网络的人脸识别算法研究26图3.3tanh函数曲线图从图3.3中我们可以看出，tanh函数的取值范围也是从正无穷到负无穷，对应的的取值范围变为-1到1，与sigmoid函数来说相比，tanh函数主要具有了更广的值域范围。由以上分析可知，sigmoid和tanh函数都具有非线性特点，从而使得该类函数可以增强中央区域的信号，以此来增强图像特征空间的映射效果。但是这两种函数都有一个共同的不足之处：当激活函数的输入值极大或者极小时，激活函数就处于饱和区，此时神经元的梯度接近于0。这种情况将会导致在反向传播阶段出现梯度消失，参数更新值的变化将会非常小，训练过程中网络的收敛速度将会变的很慢，训练的时间成本将会增多。同时，当我们在使用sigmoid和tanh作为激活函数的时候，由于激活函数的计算较为复杂，网络模型的前向传播和反向传播的计算量较大。21世纪初，科学家Abott和Dayan通过大量的实验进行相关的结果分析，最终模拟出了新的激活函数relu函数[54]。新的relu函数与上文介绍的sigmoid和tanh激活函数相比，在以下方面做了相应的改进措施：（1）relu函数的响应激活只有右半边，这样可以使激活函数的单侧得到抑制，极大地提高了效率。（2）relu函数扩大了整个兴奋边界，函数取值范围将会扩充至[0,+∞]。（3）relu函数引入了的新规则即信号激活具有稀疏性。relu函数的表达式如式(3-4)所示，函数曲线图如图3.4所示。()={0,<0,≥0(3-4)

函数曲线图,函数,损失函数,平方差

3基于浅层卷积神经网络的人脸识别研究27图3.4relu函数曲线图relu函数应用的广泛性的主要原因是该函数特性与人类神经元细胞对信号的反应是非常相似的，即一方面重视正向信号，另一方面忽略负向信号。同时，该函数成功地简化了运算操作，很大程度地提高了机器的运行效率。因此relu函数在神经网络中取得了较好的拟合效果。由此，我们可以得出以下结论：当需要对图像特征进行更细小的分类判断时，使用sigmoid函数会更好。而tanh函数适用于特征相差比较明显时的情况，这是因为在神经网络的训练过程中，运算特征在不断进行循环计算使得每个神经元的值也是在不断发生改变的，此时使用tanh函数会将特征扩大并显示出来[52]。而对于后期出现的relu函数来说，它的优点是经过该函数处理之后的数据具有较好的稀疏性，即数据转换为只包含最大数值和0的数据，这样的变换效果可以最大程度地保留输入图像数据的特征，以此使神经网络模型在迭代运算中能够得到更优异的效果。因此在本文改进的结构中，将舍弃sigmoid函数改用relu函数进行激活操作。3.2.3损失函数选取损失函数是网络学习质量的关键。对于任何一种网络结构，如果使用了不恰当的损失函数，那么正确有效的网络模型将难以被训练出来。损失函数一般常用来描述网络模型预测值和真实值之间的差距大校目前有两种较为常见的算法：均值平方差和交叉熵。（1）均值平方差均值平方差(MSE)也称之为均方误差，在神经网络中主要用来描述模型预测值与真实值之间的差异。在数理统计中，均方误差表示参数估计值与参数真值之
【相似文献】

相关期刊论文前10条

1 董洛丞;陈张平;;基于改进的卷积神经网络的人脸识别算法[J];杭州电子科技大学学报(自然科学版);2018年05期

2 祁彦庆;汪烈军;吴生武;;一种基于稀疏表达和神经网络的人脸识别算法[J];计算机应用与软件;2016年10期

3 邱文龙;;一种改进的卷积神经网络人脸识别算法[J];现代计算机(专业版);2018年18期

4 王飞;;基于主分量分析GA-BP神经网络的人脸识别算法[J];中国西部科技;2015年06期

5 刘亮;;基于改进卷积神经网络的人脸识别算法[J];科技通报;2019年07期

6 李军政;;基于神经网络算法的机器学习模型研究[J];传播力研究;2017年10期

7 李英龙;童光煦;;正交设计-神经网络方法[J];金属矿山;1993年06期

8 赵琦;孟祥宁;朱苗勇;;基于模糊聚类及神经网络的连铸漏钢预报[J];中国冶金;2008年02期

9 林城龙;胡伟;李瑞瑞;;基于深度卷积神经网络的层次多任务服装分类[J];中国体视学与图像分析;2018年02期

10 张涛涛;陈丽萍;蒋兵;戴礼荣;;采用深度神经网络的说话人特征提取方法[J];小型微型计算机系统;2017年01期

相关博士学位论文前10条

1 肖理业;基于机器学习的电磁场建模与设计研究[D];电子科技大学;2019年

2 陈涵瀛;核电站热工水力系统工况预测与诊断方法研究[D];哈尔滨工程大学;2018年

3 梁智杰;聋哑人手语识别关键技术研究[D];华中师范大学;2019年

4 刘昂;微结构硅基光子学器件性能的研究[D];南京大学;2019年

5 赵博雅;基于卷积神经网络的硬件加速器设计及实现研究[D];哈尔滨工业大学;2018年

6 杜昌顺;面向细分领域的舆情情感分析关键技术研究[D];北京交通大学;2019年

7 陈科海;机器翻译上下文表示方法研究[D];哈尔滨工业大学;2019年

8 饶红霞;信息受限下神经网络的状态估计和拟同步研究[D];广东工业大学;2019年

9 张马路;Spiking机器学习算法研究[D];电子科技大学;2019年

10 付钱华;忆阻神经网络的动力学研究[D];电子科技大学;2019年

相关硕士学位论文前10条

1 段旭豪;基于神经网络的人脸识别算法研究[D];江西财经大学;2020年

2 袁崇涛;基于神经网络的人脸识别算法研究[D];大连理工大学;2006年

3 王双印;基于卷积神经网络的人脸识别研究[D];兰州理工大学;2017年

4 代光海;基于神经网络的运动想象脑电信号识别技术研究[D];电子科技大学;2020年

5 李永礼;基于脉冲神经网络的视觉图像分类方法研究[D];北京化工大学;2019年

6 陈泽洲;自然场景下的深度人脸识别方法[D];电子科技大学;2017年

7 张毅;静态手势识别的神经网络方法研究[D];电子科技大学;2011年

8 张丽;情感神经网络及其在人脸识别中的应用研究[D];江西理工大学;2012年

9 凌红英;神经网络在模拟电路故障诊断中的方法研究[D];扬州大学;2008年

10 裴子龙;基于卷积神经网络的人脸性别识别研究[D];山西师范大学;2017年

本文编号：2880546

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/shoufeilunwen/xixikjs/2880546.html

上一篇：基于云平台下嵌入GPU并行计算框架的人脸检测系统研究
下一篇：RV减速器关键性能指标检测方法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|