基于多监督信息的级联全卷积人脸检测算法
本文选题:人脸检测 + 深度学习 ; 参考:《哈尔滨工业大学》2017年硕士论文
【摘要】:目前,人脸检测是计算机领域重点研究方向之一,无论在科研领域还是商用领域都具有较大的研究价值。在科研领域上,检测问题是计算机视觉领域的一个基础性课题。人脸检测在人脸领域中作为人脸对齐、人脸识别、人脸验证的基础问题,一直被大量的研究。实现在商业领域中,安防,金融,卡口等自然复杂场景中自动快速准确地检测并识别人脸是工业界的目标。但由于真实场景的复杂性,以及人脸检测容易受到人脸姿态、角度、位置、背景等诸多因素变化的影响,导致人脸检测仍有许多难点没有彻底解决。人脸检测任务可以拆分成判别人脸的二分类子任务和人脸搜索策略子任务。人脸二分类子任务是判断某一个区域是否是人脸,人脸搜索策略子任务则是在整张图片中搜索人脸。人脸二分类模型越简单,且人脸搜索的区域越少,则人脸检测算法的运行速度就越快。目前人脸检测算法处于顾此失彼的困境。效果好的算法由于模型过于复杂,运行速度没办法达到实时,而能达到实时的算法因为模型比较简单,导致算法本身的效果却不是很好。如何训练出一个速度又快,而且效果又好的人脸检测是人们非常关心的问题。目前主流方法将这两个子任务独立看待,即分类模型使用深度卷积网络,人脸搜索采用滑动窗口、选择性搜索等策略,导致计算资源消耗过多,检测时间过长等问题。本文提出了一个模型简单,检测准确,且能同时检测多个尺度的人脸检测算法。本文从全卷积网络出发,将这两个子任务有效的结合起来,训练出一个不限制人脸尺度大小的人脸检测模型。全卷积网络和一般的卷积神经网络相比有着空间位置信息的优势,故相比于一般的卷积神经网络来说,全卷积网络更适合做检测、分割等任务。在测试的时候,就不需要将图像放缩多个尺度再分别测试,而是通过一次测试将大部分人脸检测出来。因为人脸尺度是非限定的,故直接训练人脸二分类模型会导致模型难以收敛或者效果较差,会产生较多的误检和漏检。为了能减少这样的问题,让模型更好地训练,本论文将级联思想引入全卷积网络中,而且在人脸二分类和人脸边界框回归中分别提出多个监督信息帮助网络更好地收敛,构造出一个基于多监督信息的全卷积人脸检测算法。本文通过在人脸检测相关评测集进行实验,一一验证提出算法的有效性,实验结果表明该算法在评测集上取得了不错的成绩。
[Abstract]:At present, face detection is one of the most important research directions in computer field, and it has great research value in both scientific and commercial fields. In the field of scientific research, detection is a basic subject in the field of computer vision. Face detection is the basic problem of face alignment, face recognition and face verification in face field. It is the target of industry to detect and recognize faces automatically and accurately in complex natural scenes such as security, finance, bayonet and so on. However, due to the complexity of the real scene and the fact that face detection is easily affected by the changes of face pose, angle, location, background and so on, there are still many difficulties in face detection that have not been solved thoroughly. The face detection task can be divided into two subtasks of face recognition and a subtask of face search strategy. The second subtask of face classification is to determine whether a certain region is a face or not, and the subtask of face search strategy is to search the face in the whole picture. The simpler the two-classification model is and the less the search area is, the faster the face detection algorithm is. At present, face detection algorithm is in the dilemma of neglecting one or the other. Due to the complexity of the model, the algorithm can not achieve real-time, but the algorithm can achieve real-time because the model is relatively simple, the result of the algorithm itself is not very good. How to train a fast and effective face detection is a very important problem. At present, the two subtasks are treated independently, that is, the classification model uses deep convolution network, the face search adopts sliding window, selective search and so on, which results in the excessive consumption of computing resources and the long detection time. In this paper, a face detection algorithm is presented, which is simple, accurate and can detect multiple scales at the same time. Based on the full convolution network, this paper combines these two subtasks effectively and trains a face detection model without limiting the face size. Compared with the general convolution neural network, the full convolution network has the advantage of spatial location information, so compared with the general convolution neural network, the full convolutional network is more suitable for the tasks of detection, segmentation and so on. In the test, we don't need to shrink the image to multiple scales and test separately. Instead, we detect most human faces by one test. Because the scale of face is not limited, direct training of the two-classification model of face will lead to the difficulty of convergence or the poor effect of the model, and will result in more misinformation and missed detection. In order to reduce this problem and train the model better, this paper introduces the concatenation idea into the full convolution network, and proposes several supervised information to help the network converge better in face two-classification and face boundary box regression. A full convolution face detection algorithm based on multi-supervised information is proposed. In this paper, the validity of the proposed algorithm is verified by experiments on the relevant evaluation set of face detection. The experimental results show that the algorithm has achieved good results in the evaluation set.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 曾素娣;范九荣;李一民;;基于肤色和几何特征的人脸检测算法[J];电脑知识与技术;2006年36期
2 赵东方;杨明;邓世涛;;几种人脸检测算法的对比研究[J];内江科技;2011年10期
3 王仕民;叶继华;罗文兵;占明艳;;嵌入式人脸检测算法的研究与实现[J];江西通信科技;2011年02期
4 金鑫;李晋惠;;基于神经网络的人脸检测算法研究[J];科技信息;2008年35期
5 翟懿奎;黄聿;谢剑华;吴志龙;郭承刚;;基于肤色的实时人脸检测算法研究[J];电子设计工程;2011年09期
6 王小兰;蔡灿辉;朱建清;;一种改进的快速人脸检测算法[J];微型机与应用;2013年15期
7 张炜;耿新;陈兆乾;陈世福;;一种基于可疑人脸区域发现的人脸检测方法[J];计算机科学;2004年04期
8 罗三定;周磊;沙莎;;一种新的快速多人脸检测算法[J];计算机应用研究;2008年04期
9 乔晓芳;吴小俊;王士同;杨静宇;;一种改进的人脸检测算法[J];计算机应用;2008年04期
10 徐显日;;视频中实时的人脸检测算法[J];福建电脑;2012年08期
相关会议论文 前2条
1 付朝霞;韩焱;王黎明;;复杂背景下视频运动目标的人脸检测算法[A];第十三届中国体视学与图像分析学术会议论文集[C];2013年
2 陈健;钱芸芸;;用DSP实现实时人脸检测[A];第二届全国信息获取与处理学术会议论文集[C];2004年
相关博士学位论文 前2条
1 周薇娜;人脸检测算法及其芯片实现关键技术研究[D];复旦大学;2012年
2 郭耸;人脸检测若干关键技术研究[D];哈尔滨工程大学;2011年
相关硕士学位论文 前10条
1 习洋洋;基于多监督信息的级联全卷积人脸检测算法[D];哈尔滨工业大学;2017年
2 赵玉亭;基于ARM9的便携式监控取证系统的研究与设计[D];西安工业大学;2015年
3 袁成林;基于支持向量机的笑脸识别算法研究[D];广西大学;2015年
4 杨万振;视频人脸检测算法研究及其DSP实现[D];东北大学;2013年
5 刘吉;基于自学习特征融合的人脸检测算法研究[D];中国海洋大学;2015年
6 马慧;人脸检测算法的设计与实现[D];东南大学;2015年
7 邹奇文;非对称人脸检测算法的研究与实现[D];华中科技大学;2014年
8 江锐;基于Cortex-A8的人脸检测系统的设计与实现[D];华中科技大学;2014年
9 张雪楠;基于PCA降维的快速人脸检测算法研究[D];燕山大学;2016年
10 罗富丽;单目可量测快速人脸检测算法[D];昆明理工大学;2016年
,本文编号:1981468
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1981468.html