基于空时关系学习的运动检测和目标跟踪研究

发布时间:2018-09-04 08:48
【摘要】:智慧城市是国家解决当前城市发展问题、增加新的经济增长点、抢占未来科技制高点的重要战略,其核心建设内容之一是智能交通。智能交通的关键技术大多涉及计算机视觉。本文利用空时关系学习对复杂场景下计算机视觉中运动目标检测和目标跟踪两个核心问题进行了技术探索,研究成果应用于智能交通之智能电子警察系统,提高了电子警察系统对环境的适应性。对于运动目标检测问题,分析了面对复杂场景代表性的运动检测方法设计中存在的不足,归纳出形成复杂场景的主要因素,深入分析了光照变化、背景扰动、相似目标、相机运动等因素对运动目标检测产生不利影响的机理,分别提出了综合利用视频图像序列在不同层面的多个因素、利用目标局部特征和空时关系以及利用目标与周围环境的空时置信关系等进行运动目标检测的方法;本文还对未知目标的长时间跟踪问题进行了研究。复杂场景下的未知目标长时跟踪面临的问题包括:目标遮挡、目标外观变化、目标尺度变化以及目标的短暂消失。深入分析了目标遮挡以及目标外观变化等情况造成目标特征缺失或者不完整的情况下,仍可利用的信息,分析并比较了代表性目标跟踪算法应对目标尺度变化和目标短暂消失的处理策略,提出了一种结合目标自身特征和目标与周围环境的空时联系,可以长时间对未知目标进行稳定跟踪的方法;最后,将以上研究成果应用于智能电子警察系统,解决了研发过程中遇到的技术困难。本文的主要研究成果和贡献:1.分析了视频目标检测中复杂场景的主要组成因素,提出一种基于尺度不变局部三元模式(SILTP)的视频图像背景建模算法。根据复杂场景对视频图像序列不同层次的不同影响,利用图像帧级、图像块级和像素级三级信息设计背景建模算法。算法融合图像帧、图像块和图像像素三个层面的优势来应对复杂场景。在图像帧级,利用全局灰度均值处理场景亮度突变;在图像块级,利用SILTP纹理图像基于图像块进行背景建模,快速定位前景目标大致轮廓;在像素级,用类ViBe算法检测前景目标精确边界。此算法挖掘空时信息并融合利用,其性能在标准视频集CDM’14上得到验证。2.面对视频目标检测的难点一目标自身投影的消除问题,构建了阴影光照模型,分析了目标阴影的种类及产生的原因。将纹理信息、色调信息和空时信息与ViBe算法相结合,提出了SAViBe+算法。首先,利用图像纹理对光照变化的弱敏感性,消除室内弱光照产生的目标投影;然后,在HSV颜色空间构建色调(Hue)模型,利用物体颜色的固有特性消除室外光照造成的目标投影;最后,为了加强目标投影的消除效果,同时提高处理速度,利用像素变化的局部相关性设计了MofV因子。用标准视频集CDM’14验证了该算法的性能。3.提出在HSV颜色空间实现鲁棒运动检测的方法DMSTAB。在HSV颜色空间,通过K-means聚类,利用像素集的空时关联产生像素的局部强度差,利用单高斯模型分别为像素的局部强度差和色调建模,然后,联合两者的结果寻找潜在的阴影像素点;接着,深入分析了ViBe背景差算法的工作原理,提出基于AdaBoost-Like方法利用潜在的阴影像素点构建双关联背景模型,实现对运动目标快速精确的检测,有效消除运动目标的自身投影。用标准视频集CDM’14上多种复杂场景验证了该方法的性能。4.提出基于空时置信关系进行运动目标检测的方法STR。本文提出一种空时置信关系,定义了像素点与其环境邻域像素点之间一种相对稳定的联系。首先,根据视觉聚焦特性和光照影响图像亮度变化的规律,定义像素点与环境像素点的空域关系;然后,利用快速核密度估计方法对空域关系的时域变化建模;此外,根据空域关系值的分散度为模型分配相应的权重;最后,通过基于权重的概率综合得到像素点属于背景的概率,完成运动目标检测。该算法性能在标准视频集CDM’14的典型复杂场景中得到验证。5.提出一种将目标与其环境的空时关联信息和目标自身特征结合使用,对未知目标进行长时间、稳定跟踪的新方法LST。该方法借鉴TLD算法框架,通过检测和跟踪两种独立途径对目标进行跟踪。算法包括检测、跟踪和学习三个功能模块。检测模块通过若干分类器级联,根据目标自身基本的图像特征在全局范围内检测目标,处理目标短暂消失又重现、目标尺度变化以及环境干扰;跟踪模块利用目标与其周围环境的空时置信关系,通过局部搜索,快速跟踪目标,处理目标遮挡、目标尺度变化;算法在运行过程中,通过维护一组由正样本组成的在线模板,对跟踪和检测效果进行评测。学习模块依据评测结果,调整检测模块和跟踪模块相关参数,实现算法的自学习。在若干对跟踪算法极具挑战性(严重遮挡、剧烈的光照变化、姿态和尺度变化、非刚性形变、复杂背景、运动模糊和相似目标)的数据集上比较了LST算法与主流视频目标跟踪算法的性能,LST算法展现出了较好的跟踪效果。6.面对电子警察系统研发过程中遇到的技术瓶颈,将运动目标检测算法STR和目标跟踪算法LST的核心技术应用于智能电子警察系统。提高了智能电子警察系统的车辆检测和车辆跟踪性能,并进一步作用于车牌识别和车辆违章行为评判,提高了电子警察系统的整体性能。该电子警察系统首期工程已经通过验收。
[Abstract]:Intelligent city is an important strategy for a country to solve the current urban development problems, increase new economic growth points, and seize the commanding heights of future science and technology. Intelligent traffic is one of its core construction contents. Two core problems of detection and target tracking are explored technically. The research results are applied to the intelligent electronic police system of intelligent transportation, which improves the adaptability of the electronic police system to the environment. The main factors of complex scenes are analyzed. The mechanism of unfavorable effects of illumination changes, background disturbance, similar targets, camera motion and other factors on moving target detection is analyzed in depth. The problem of long-term tracking of unknown targets in complex scenes includes: object occlusion, object appearance change, object scale change and short-term disappearance of the target. In the case of target feature missing or incomplete due to the change of target appearance, the available information is analyzed and compared. A representative target tracking algorithm is proposed to deal with the change of target scale and the short-term disappearance of target. Finally, the above research results are applied to the intelligent electronic police system to solve the technical difficulties encountered in the development process. The main research results and contributions of this paper are as follows: 1. The main components of complex scenes in video object detection are analyzed, and a scale-invariant approach is proposed. Local ternary mode (SILTP) video image background modeling algorithm. According to the different effects of complex scenes on different levels of video image sequences, the background modeling algorithm is designed using three levels of information: frame level, image block level and pixel level. The algorithm combines the advantages of image frame, image block and image pixel to deal with complex scenes. At the frame level, the global gray mean is used to deal with the sudden change of scene brightness; at the image block level, the SILTP texture image is used to model the background based on the image block to quickly locate the outline of the foreground target; at the pixel level, the precise boundary of the foreground target is detected by the ViBe-like algorithm. Confronted with the difficulty of video object detection, i.e. the elimination of object self-projection, a shadow illumination model is constructed, and the types and causes of object shadows are analyzed. The weak sensitivity of illumination changes eliminates the target projection caused by indoor weak illumination; then, a hue model is constructed in HSV color space to eliminate the target projection caused by outdoor illumination by using the intrinsic characteristics of object color; finally, in order to enhance the elimination effect of target projection and improve the processing speed, the local correlation of pixel changes is used. MofV factor is designed. The performance of the algorithm is verified by the standard video set CDM'14. 3. A robust motion detection method DMSTAB is proposed in HSV color space. In HSV color space, the local intensity difference of pixels is generated by K-means clustering, and the local intensity difference of pixels is generated by spatial-temporal correlation of pixel sets. Then, the working principle of Vibe background subtraction algorithm is deeply analyzed, and a bi-correlation background model based on AdaBoost-Like method is proposed to detect moving objects quickly and accurately and eliminate moving objects effectively. Projection. The performance of this method is validated by a variety of complex scenes on the standard video set CDM'14. 4. A space-time confidence relation based moving object detection method STR is proposed. In this paper, a space-time confidence relation is proposed, and a relatively stable relation between pixels and their neighborhood pixels is defined. Then, a fast kernel density estimation method is used to model the temporal variation of spatial relationship. In addition, the corresponding weights are assigned to the model according to the dispersion of spatial relationship values. Finally, the pixels are synthesized by the probability based on weights. The algorithm is validated in typical complex scenes of standard video set CDM'14. 5. A new method LST is proposed, which combines the space-time association information of the target and its environment with the target's own characteristics to track unknown targets for a long time and stably. The algorithm consists of three functional modules: detection, tracking and learning. The detection module cascades through several classifiers, detects the target in the global scope according to the basic image features of the target itself, handles the transient disappearance and recurrence of the target, changes in target scale and environment. The tracking module uses the space-time confidence relationship between the target and its surroundings to track the target quickly through local search, deal with the occlusion of the target and the change of the target scale; the algorithm evaluates the tracking and detection effect by maintaining a set of online templates composed of positive samples in the running process. The learning module adjusts the tracking and detection results according to the evaluation results. The LST algorithm is compared with the mainstream video target tracking algorithm on several datasets which are challenging to the tracking algorithm (severe occlusion, drastic illumination changes, attitude and scale changes, non-rigid deformation, complex background, motion blur and similar targets). ST algorithm shows a good tracking effect. 6. In the face of the technical bottleneck encountered in the development of the electronic police system, the core technology of moving target detection algorithm STR and target tracking algorithm LST is applied to the intelligent electronic police system. The vehicle detection and tracking performance of the intelligent electronic police system are improved, and further acts on it. License plate recognition and vehicle violation judgment have improved the overall performance of the electronic police system.
【学位授予单位】:西安电子科技大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 张涛;张桂林;;运动检测中的背景建立和更新[J];计算机与数字工程;2007年02期

2 刘振宇;周莉;陈杰;;一种基于运动检测的码率控制算法[J];科学技术与工程;2010年20期

3 闫石;白振兴;代忠;;对传统运动检测算法改进的研究[J];现代电子技术;2007年06期

4 顾敏剑;;基于运动检测的远程图像采集系统的设计与实现[J];计算机与数字工程;2012年08期

5 强俊;周鸣争;;基于正交Gaussian-Hermite矩的运动检测在去隔行中的研究[J];安徽工程大学学报;2013年02期

6 胡俊,苏祥芳,刘立海,沈芸,管鲍,王延平;图像序列运动检测算法的研究及其应用[J];武汉大学学报(自然科学版);2000年05期

7 周西汉,刘勃,周荷琴;一种基于对称差分和背景消减的运动检测方法[J];计算机仿真;2005年04期

8 蓝照华;傅文利;赵进创;陈涛;;边缘面积值绝对差数累积运动检测算法[J];微计算机信息;2006年33期

9 张凯;;视频运动检测算法的研究和分析[J];辽宁工学院学报;2007年01期

10 侯叶;郭宝龙;;基于图切割的人体运动检测[J];光电子.激光;2007年06期

相关会议论文 前8条

1 郭锐;;运动检测报警在监控系统中的设计与实现[A];科学发展与社会责任(A卷)——第五届沈阳科学学术年会文集[C];2008年

2 唐晓丹;苗振江;;视频监控系统中人的运动检测方法研究[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年

3 李东光;殷俊;房慧敏;;基于生物复眼结构的视觉运动检测研究[A];2004全国光学与光电子学学术研讨会、2005全国光学与光电子学学术研讨会、广西光学学会成立20周年年会论文集[C];2005年

4 傅松寅;蒋刚毅;郁梅;;一种基于像素变化检测的自适应实时运动检测系统[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年

5 陈威宇;孟利民;;视频图像序列混合运动检测方法[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年

6 徐萧萧;陈宗海;;基于视觉信息的目标检测与跟踪技术现状与趋势[A];2007系统仿真技术及其应用学术会议论文集[C];2007年

7 马强;罗喜伶;;空基交通监视系统中的运动目标检测方法研究[A];2008第四届中国智能交通年会论文集[C];2008年

8 辛颖;吴强;孙光民;徐颖;姚明;;智能化公交系统的客流跟踪计数综述[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

相关博士学位论文 前4条

1 范志辉;基于空时关系学习的运动检测和目标跟踪研究[D];西安电子科技大学;2016年

2 李宏友;基于视频的目标检测与跟踪方法研究[D];重庆大学;2009年

3 沈宇键;变参数图像回归处理方法的研究[D];中国科学院长春光学精密机械与物理研究所;2000年

4 康锋;基于视觉特征的早期农林火灾检测方法的基础研究[D];浙江大学;2010年

相关硕士学位论文 前10条

1 李运崇;基于形状识别的运动物体检测[D];郑州大学;2015年

2 樊建霞;家庭环境下的人体跟踪与定位[D];山东大学;2015年

3 余传桂;网络化数字健身系统设计与实现[D];南昌大学;2015年

4 吴卫东;基于视觉注意机制的视频显著目标检测技术研究[D];北京工业大学;2015年

5 周文彬;去隔行算法的FPGA实现[D];西安电子科技大学;2014年

6 乔鹏;基于视频的车辆运动检测和流量统计算法研究[D];国防科学技术大学;2013年

7 李冰冰;面向学生人群的运动检测算法研究及软件开发[D];浙江工业大学;2015年

8 卫伟;基于FPGA的2D转3D实时视频转换技术的研究及实现[D];合肥工业大学;2015年

9 李飞;智能视频监控系统中运动检测算法的研究[D];重庆大学;2015年

10 白金辉;面向能量回收的MIMU人体运动检测识别方法研究及系统实现[D];东南大学;2015年



本文编号:2221594

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2221594.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8d2e4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com