视频中多视点人脸检测技术的研究
本文选题:人脸检测 + 多视点 ; 参考:《深圳大学》2017年硕士论文
【摘要】:社会治安一直是民生生活中一大难题。而对于人口密集,流动性大的城市,治安问题更为严重。出于电子技术的发展,各种社会治安场合已经安装了摄像头进行监控,籍此缓解治安压力。事发后,视频资料是可提供破案线索的重要信息。即便如此,视频资料的人脸信息收集仍然需要人力资源。通过电脑检测则可以很好的自动化这一过程,但对于检测技术来说,一些特殊情景仍然难以处理:比如对于非完整目标的检测;再比如从设施安放来看,摄像头的位置可能被人为移动,造成旋转、部分遮挡等等也会对检测的效果造成干扰。以往的检测方式在直立的脸检测较好,而对发生旋转、部分遮挡的目标检测效果则不好。出于此类原因,本文训练了一个在旋转、遮挡方面有较强适应性的检测器。在视频检测中利用视频的时空间一致性信息改进检测效果,并训练了一个卷积神经网络用来估计不同视点下的人脸姿态。具体贡献如下:首先,本文基于卷积神经网络训练了一个人脸检测器,并对其进行了优化改进。优化网络模型设计,减少需要学习的参数量。利用样本扩充技术、改善样本分布提高学习效果。引入非完整的人脸作为弱正样本,以解决遮挡问题。对于弱正样本与正样本得分相同而使得依赖得分和重叠率的非极大值抑制算法失效的问题,本文提出利用不均衡样本的策略去增强正样本的分值。其次,视频中存在运动模糊、遮挡、形态变化、光照变化等,仅仅使用图片检测手段不能取得很好的效果。本文利用视频的特性如时空间一致性、运动场等信息,平滑检测效果,与未利用视频特性的检测器在效果上进行对比。再者,对于多视点问题,不同视点下所观察到人类的姿态有着不同的俯仰、朝向、旋转。传统的姿态评估方法通常是通过回归的方法得到人脸的一些关键点的位置,如眼睛、鼻子、嘴巴,然后用一个3D的人脸模型的不同姿态下的2D投影使得模型上的关键点与2D投影中的关键点尽可能的匹配,以此来得到人脸的姿态。本文训练一个卷积神经网络,直接得到人脸的姿态,避免了制作3D模型、与3D模型进行匹配的过程。
[Abstract]:Social security has always been a major problem in people's livelihood. For densely populated, mobile cities, the security problem is even more serious. Due to the development of electronic technology, cameras have been installed in various social security situations to relieve the pressure of public order. After the incident, video data can provide clues to solve the case important information. Even so, the face information collection of video data still needs human resources. Computer testing is a good way to automate this process, but for detection techniques, some particular scenarios are still difficult to handle: for example, detection of non-complete targets, or, from the point of view of facility placement, The position of the camera may be moved artificially, causing rotation, partial occlusion and so on. In the past, the detection method was better in upright face, but bad in target detection with rotation and partial occlusion. For this reason, we have trained a detector with strong adaptability in rotation and occlusion. In video detection, the temporal and spatial consistency information of video is used to improve the detection effect, and a convolution neural network is trained to estimate the face pose at different viewpoints. The specific contributions are as follows: firstly, a human face detector is trained based on convolutional neural network and optimized. Optimization of network model design to reduce the number of parameters to learn. Using the technique of sample expansion to improve the distribution of samples and improve the learning effect. In order to solve the occlusion problem, a nonholonomic face is introduced as a weak positive sample. For the problem that the weak positive sample has the same score as the positive sample and makes the non-maximum suppression algorithm dependent on score and overlap rate invalid, this paper proposes a strategy of using unbalanced samples to enhance the score of positive samples. Secondly, there are motion blur, occlusion, morphological changes, illumination changes and so on in the video. Only using image detection methods can not achieve good results. In this paper, the features of video, such as time-space consistency, sports field and other information, are used to smooth the detection effect, and compared with the detector without video characteristics. Furthermore, for the multi-view problem, the human attitude observed at different viewpoints has different pitching, orientation and rotation. Traditional attitude assessment methods usually use regression method to get the position of some key points of the face, such as eyes, nose, mouth, Then 2D projection of a 3D face model is used to make the key points of the model match the key points of 2D projection as far as possible to get the pose of human face. In this paper, we train a convolutional neural network to get face pose directly and avoid the process of making 3D model and matching 3D model.
【学位授予单位】:深圳大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 饶鲜;杨绍全;魏青;董春曦;;基于熵的入侵检测特征参数选择[J];系统工程与电子技术;2006年04期
2 王东琦,王长山,林延福;检测SYN洪水攻击的动态模型[J];现代电子技术;2004年23期
3 周勇林;由林麟;张永铮;;基于命名及解析行为特征的异常域名检测方法[J];计算机工程与应用;2011年20期
4 李彬,戴银涛,胡昌振;Linux下一种入侵检测特征提取及规则制定方法[J];计算机安全;2003年11期
5 曹政;入侵检测技术,鸡肋还是机会?——入侵检测的几个问题和解决途径[J];网络安全技术与应用;2003年04期
6 孟磊;刘胜利;刘龙;陈嘉勇;孙海涛;;基于心跳行为分析的木马快速检测方法[J];计算机工程;2012年14期
7 张小兵,叶新铭,石立新;入侵检测中的告警分析研究[J];内蒙古大学学报(自然科学版);2004年05期
8 蒋宗华;刘军;;基于动态克隆选择的入侵检测及其搜索核特征的研究[J];电脑与信息技术;2006年06期
9 胡建康;徐震;马多贺;杨婧;;基于决策树的Webshell检测方法研究[J];网络新媒体技术;2012年06期
10 黎利辉;;基于遗传模拟退火算法的入侵检测特征选择研究[J];计算机安全;2010年07期
相关重要报纸文章 前1条
1 金婉霞 本报记者 王春;检测H7N9 仅需两小时[N];科技日报;2013年
相关博士学位论文 前10条
1 姜德迅;代码坏味检测方法研究及重构分析[D];哈尔滨工业大学;2014年
2 任少卿;基于特征共享的高效物体检测[D];中国科学技术大学;2016年
3 许舟军;基于异常分析的入侵检测关键技术研究[D];天津大学;2006年
4 郁继锋;基于数据挖掘的Web应用入侵异常检测研究[D];华中科技大学;2011年
5 任斐;基于数据挖掘的自适应异常检测研究[D];吉林大学;2009年
6 滕少华;基于对象监控的分布式协同入侵检测[D];广东工业大学;2008年
7 李战春;入侵检测中的机器学习方法及其应用研究[D];华中科技大学;2007年
8 李鸿彬;SIP网络中入侵检测与防御系统关键技术的研究[D];中国科学院研究生院(沈阳计算技术研究所);2012年
9 刘长龙;基于侧信道分析的硬件木马检测技术研究[D];天津大学;2013年
10 张福勇;面向恶意代码检测的人工免疫算法研究[D];华南理工大学;2012年
相关硕士学位论文 前10条
1 胥小马;使用多特征和多线索的驾驶员人脸检测技术[D];北京理工大学;2015年
2 李先飞;基于外貌特征的行人检测方法研究与软件实现[D];电子科技大学;2014年
3 刘秋荣;面向代码坏味检测的阈值动态优化方法[D];北京理工大学;2016年
4 崔静静;基于I-K-Means聚类的朴素贝叶斯HRNB分类算法在入侵检测中的应用研究[D];河南理工大学;2014年
5 成俊;基于人体部件的复杂场景行人检测研究[D];南昌航空大学;2016年
6 张瑞琴;基于信息熵聚类的异常检测方法研究[D];北京交通大学;2016年
7 温天宇;基于特征选择的托攻击检测研究[D];华侨大学;2016年
8 张宇;复杂环境下的行人检测[D];电子科技大学;2016年
9 瞿志强;基于部件模型的复杂环境行人检测技术研究[D];国防科学技术大学;2014年
10 李来群;视频中多视点人脸检测技术的研究[D];深圳大学;2017年
,本文编号:1837099
本文链接:https://www.wllwen.com/guanlilunwen/renliziyuanguanlilunwen/1837099.html