基于深度学习的人眼检测及应用研究
发布时间:2021-03-01 00:15
眼睛为人类提供了感知外界事物最主要和最直接的视觉能力,其有效传递了重要的身份和状态信息。人眼检测即在图像中确定人眼的存在性、位置和尺度等。人眼检测作为模式识别中的一个分支,具有重要的研究意义和应用价值。传统人眼检测算法由于精度低且鲁棒性差,已经无法适应如今复杂场景下的应用需求。因此,本文着重研究了基于深度学习的复杂场景下人眼检测算法,并将其应用到人眼身份识别和疲劳驾驶检测研究之中。所做具体工作如下:(1)以传统Adaboost方法作为人眼检测研究的出发点,分析了影响基于Adaboost级联分类器的人眼检测性能的因素即正负样本集选取规则和不同的特征模板,并通过对比实验总结最佳人眼检测模型训练方案。依据传统检测模型在复杂场景下的实际表现论证了其应对目前的人眼检测还存在不足之处,进而引出基于深度学习方法的人眼检测研究方案。(2)提出了基于改进YOLOv3的人眼检测算法。针对复杂场景下传统人眼检测方法的局限性,提出了一种不依赖于人脸检测的直接人眼检测算法,解决了复杂场景下多尺度尤其是小尺度人眼检测问题。该算法通过减少骨干网络中下采样因子并且加入了扩张残差单元以提升小尺度人眼的检测能力,对多尺度...
【文章来源】:北方工业大学北京市
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
积分图示意图
第二章基于Adaboost的人眼检测初探9值,所以Adaboost算法的训练耗时会受到每一个待检目标区域所含特征数量多少的影响。输入检测图像大小以及检测窗口中特征模板的缩放、平移和旋转都是造成大量特征计算的直接因素,而获取这些特征并计算其特征值是训练分类器的必要前提。在一幅的30×30像素图像中,大约需要描述的边缘特征有5万个,线性特征的数量则更多,如果采用基本Haar特征表征该图像,在训练分类器时需要大约40万个Haar特征,换言之就是求解特征值需要经过40万余次运算。通过表2-1能够直接看出不同大小待检图像窗口中Haar特征数量的多少[41]。表2-1窗口大小与Haar特征数量的关系窗口尺寸16×1620×2024×2430×3036×36特征数量3238478460162336394725816264随着待检窗口尺寸的增大,其窗口内需要计算的特征数量基本呈现指数级增长,如此庞大的特征计算量势必会直接导致分类器的训练效率和检测速度大幅下降,导致算法无法被实际应用。因此Viola在特征计算中使用积分图的思想以加快计算速度[42]。如图2-2所示,一幅图像I(x,y)中某一个像素点A(x,y)处的积分图表示为i(x,y)即图像左上端点与该点A组成的矩形区域内全部像素值的和,定义为公式(2-1):i(x,y)=∑I(x,,y,)x,≤x,y,≤y(2-1)图2-2积分图示意图图2-3积分图计算示例按照积分图的定义,图2-3中像素点1处的积分图为A矩形的像素值之和,像素点2处的积分图为A矩形和B矩形的像素值之和,同理可得3、4、5、6四个像素点的积分图,那么计算矩形D、F区域内像素值之和如公式(2-2)和(2-3):Sum(D)=i(1)+i(4)-(i(2)+i(3))(2-2)Sum(F)=i(3)+i(6)-(i(4)+i(5))(2-3)
第二章基于Adaboost的人眼检测初探16图2-9不包含人眼的任意图像(2)正样本为扩展到眉毛边缘的矩形区域图像,负样本仍然为不包含人眼的任意图像。训练正样本为扩展到眉毛边缘的矩形区域图像2430张,同样选择不包含人眼区域的任意图像7300张作为负样本,采用MB-LBP特征训练分类器并对正样本归一化大小为48×24。样本选取如图2-10所示。图2-10扩展到眉毛边缘的矩形人眼区域图像(3)正样本为扩展到眉毛边缘的矩形区域图像,负样本去除人眼后的其他面部区域图像。正样本数量和(2)保持一致,负样本集为7300张去除人眼后的其他面部区域图像。同样选择MB-LBP特征训练分类器并归一化正样本大小为48×24。负样本选取如图2-11所示。图2-11去除人眼后的其他面部区域图像表2-2为三组不同训练集上测试的误检率及检测率,从表中可以看出组合3是最佳人眼检测方案,其检测率明显高于另外两者,误检及漏检也明显较低。由此可以得出,正样本数据中只包含特征信息较少的眼睛轮廓区域会导致分类器的检测性能下降。负样本中存在大部分与眼睛相似性很低的自然背景图像时,由于这些相关度较低的数据在训练时作为易于区分的样本无法通过前几层强分类器的判决,而主要负责对不易区分的样本进行决策的后几层强分类器所需训练负样本数量过少,从而导致分类器的检测精度下降。
【参考文献】:
期刊论文
[1]深度神经网络的关键技术及其在自动驾驶领域的应用[J]. 李升波,关阳,侯廉,高洪波,段京良,梁爽,汪玉,成波,李克强,任伟,李骏. 汽车安全与节能学报. 2019(02)
[2]混合Boost算法实现的行人检测技术[J]. 陈超. 计算机应用与软件. 2019(06)
[3]基于积分投影和差分投影的人眼定位[J]. 侯向丹,赵丹,刘洪普,顾军华. 计算机工程与科学. 2017(03)
[4]基于面部特征识别的管制员疲劳监测方法研究[J]. 汪磊,孙瑞山. 中国安全科学学报. 2012(07)
[5]基于Hough变换圆检测的人眼精确定位方法[J]. 张杰,杨晓飞,赵瑞莲. 计算机工程与应用. 2005(27)
博士论文
[1]人眼检测与跟踪的方法及应用研究[D]. 孟春宁.南开大学 2013
硕士论文
[1]多波段红外图像差异特征形成机理研究[D]. 朱小红.中北大学 2016
[2]基于驾驶操作及车辆状态的疲劳驾驶行为检测研究[D]. 黄皓.东南大学 2016
[3]快速人眼检测若干关键技术的研究[D]. 黄程.南昌大学 2015
本文编号:3056660
【文章来源】:北方工业大学北京市
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
积分图示意图
第二章基于Adaboost的人眼检测初探9值,所以Adaboost算法的训练耗时会受到每一个待检目标区域所含特征数量多少的影响。输入检测图像大小以及检测窗口中特征模板的缩放、平移和旋转都是造成大量特征计算的直接因素,而获取这些特征并计算其特征值是训练分类器的必要前提。在一幅的30×30像素图像中,大约需要描述的边缘特征有5万个,线性特征的数量则更多,如果采用基本Haar特征表征该图像,在训练分类器时需要大约40万个Haar特征,换言之就是求解特征值需要经过40万余次运算。通过表2-1能够直接看出不同大小待检图像窗口中Haar特征数量的多少[41]。表2-1窗口大小与Haar特征数量的关系窗口尺寸16×1620×2024×2430×3036×36特征数量3238478460162336394725816264随着待检窗口尺寸的增大,其窗口内需要计算的特征数量基本呈现指数级增长,如此庞大的特征计算量势必会直接导致分类器的训练效率和检测速度大幅下降,导致算法无法被实际应用。因此Viola在特征计算中使用积分图的思想以加快计算速度[42]。如图2-2所示,一幅图像I(x,y)中某一个像素点A(x,y)处的积分图表示为i(x,y)即图像左上端点与该点A组成的矩形区域内全部像素值的和,定义为公式(2-1):i(x,y)=∑I(x,,y,)x,≤x,y,≤y(2-1)图2-2积分图示意图图2-3积分图计算示例按照积分图的定义,图2-3中像素点1处的积分图为A矩形的像素值之和,像素点2处的积分图为A矩形和B矩形的像素值之和,同理可得3、4、5、6四个像素点的积分图,那么计算矩形D、F区域内像素值之和如公式(2-2)和(2-3):Sum(D)=i(1)+i(4)-(i(2)+i(3))(2-2)Sum(F)=i(3)+i(6)-(i(4)+i(5))(2-3)
第二章基于Adaboost的人眼检测初探16图2-9不包含人眼的任意图像(2)正样本为扩展到眉毛边缘的矩形区域图像,负样本仍然为不包含人眼的任意图像。训练正样本为扩展到眉毛边缘的矩形区域图像2430张,同样选择不包含人眼区域的任意图像7300张作为负样本,采用MB-LBP特征训练分类器并对正样本归一化大小为48×24。样本选取如图2-10所示。图2-10扩展到眉毛边缘的矩形人眼区域图像(3)正样本为扩展到眉毛边缘的矩形区域图像,负样本去除人眼后的其他面部区域图像。正样本数量和(2)保持一致,负样本集为7300张去除人眼后的其他面部区域图像。同样选择MB-LBP特征训练分类器并归一化正样本大小为48×24。负样本选取如图2-11所示。图2-11去除人眼后的其他面部区域图像表2-2为三组不同训练集上测试的误检率及检测率,从表中可以看出组合3是最佳人眼检测方案,其检测率明显高于另外两者,误检及漏检也明显较低。由此可以得出,正样本数据中只包含特征信息较少的眼睛轮廓区域会导致分类器的检测性能下降。负样本中存在大部分与眼睛相似性很低的自然背景图像时,由于这些相关度较低的数据在训练时作为易于区分的样本无法通过前几层强分类器的判决,而主要负责对不易区分的样本进行决策的后几层强分类器所需训练负样本数量过少,从而导致分类器的检测精度下降。
【参考文献】:
期刊论文
[1]深度神经网络的关键技术及其在自动驾驶领域的应用[J]. 李升波,关阳,侯廉,高洪波,段京良,梁爽,汪玉,成波,李克强,任伟,李骏. 汽车安全与节能学报. 2019(02)
[2]混合Boost算法实现的行人检测技术[J]. 陈超. 计算机应用与软件. 2019(06)
[3]基于积分投影和差分投影的人眼定位[J]. 侯向丹,赵丹,刘洪普,顾军华. 计算机工程与科学. 2017(03)
[4]基于面部特征识别的管制员疲劳监测方法研究[J]. 汪磊,孙瑞山. 中国安全科学学报. 2012(07)
[5]基于Hough变换圆检测的人眼精确定位方法[J]. 张杰,杨晓飞,赵瑞莲. 计算机工程与应用. 2005(27)
博士论文
[1]人眼检测与跟踪的方法及应用研究[D]. 孟春宁.南开大学 2013
硕士论文
[1]多波段红外图像差异特征形成机理研究[D]. 朱小红.中北大学 2016
[2]基于驾驶操作及车辆状态的疲劳驾驶行为检测研究[D]. 黄皓.东南大学 2016
[3]快速人眼检测若干关键技术的研究[D]. 黄程.南昌大学 2015
本文编号:3056660
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3056660.html
最近更新
教材专著