视频监控中的前景目标检测算法研究
发布时间:2020-11-05 16:27
近年来,视频监控无论是在工业生产还是安防领域中都发挥着举足轻重的作用,其主要特征是采用机器视觉的方法,通过对传感器获取到的视频(或图像序列)进行自动计算与分析,实现对监控场景中的目标进行检测、跟踪、定位和识别,并在此基础上对目标的行为做出分析和判断,从而做到既能完成常规监视,又可以在异常事件发生时及时做出反应。前景目标检测属于监控系统的前端处理部分,是后续各种高级处理任务(如目标跟踪、目标识别、视频编码、视频分析等)的基础。在过去的几十年中,前景目标检测技术受到了国内外学者的广泛研究,大量算法的提出使得前景目标检测技术取得了可观的进步,并由实验走向了具体应用。但是由于实际场景中包含各种各样的复杂因素,如光照变化、动态背景、相机抖动、阴影以及伪装等干扰,设计一个实时性好,鲁棒性强的前景目标检测算法仍然具有重大研究意义。本研究课题以监控视频作为研究对象,进行前景目标检测方面的应用算法相关研究,目的是为基于数字图像处理的视频监控系统的实用化提供理论依据和实践参考。本文主要的创新性研究工作及研究成果如下:1)提出多种新的纹理特征算子用于前景目标检测。颜色特征作为最常见的特征广泛应用于计算机视觉的各个领域,但是在面对包含光照变化、伪装、阴影等干扰因素的监控场景,颜色特征具有很大的局限性,因此很多经典的纹理特征例如LBP、LTP、LDP等被提出并应用于前景目标检测,这些纹理特征在面对光照变化、阴影等干扰表现出很好的鲁棒性。但是监控场景还可能包含很多其他干扰因素:噪声、相机抖动、动态背景等等,而大多数纹理特征在面对这些干扰通常表现效果很差,因此本文在现有纹理特征的基础上考虑从多个方面进行改进,使其对监控场景的各种干扰因素具有更好的鲁棒性;与此同时,相比于只使用单一的颜色特征或者纹理特征用于前景目标检测,本文通过将颜色特征和纹理特征相结合,充分利用两种特征优劣互补进行背景建模,实验结果表明与同类算法相比,本文算法在实时性、精度等方面都取得了更好的结果。2)提出了一种多尺度全卷积网络结构用于前景目标检测。近年来,卷积神经网络在计算机视觉的各个领域取得了突破性进展,因此有研究人员开始尝试将卷积神经网络应用于前景目标检测领域,但是其主要思想都是基于图像块的预测方法,通过在各个像素周围截取一小部分图像块来预测每个像素的输出类别标签,而这种方式有很多缺点,比如速度慢,计算冗余,而且精度不高。全卷积网络结构的提出为这种像素级分类任务提供了一种端到端的预测方式,本文尝试将全卷积网络结构应用到前景目标检测,实验结果表明全卷积网络结构比基于图像块预测的方式在速度、精度上都有明显提高。同时,借鉴近年来出现的一些新的网络结构设计思想,提出一种多尺度全卷积网络结构用于前景目标检测,实验结果表明,本文算法在公共评测数据集上取得了较优的结果,而且能满足实时性要求。3)提出了一种将传统前景目标检测算法与语义分割算法相结合的实时前景目标检测算法框架。现有的基于卷积神经网络的前景目标检测算法对每个监控场景都需要进行模型训练,因此他们在实际监控场景中应用有限。本文提出一种将传统前景目标检测算法与语义分割算法相结合的实时前景目标检测算法框架,该算法不需要对每个应用场景都进行模型训练,属于无监督型的前景目标检测算法。其核心思想是借助语义信息来提高前景目标检测算法的建模能力,实际监控场景中,经常会出现物体阴影、噪声、动态背景等干扰因素,这些因素对传统前景目标检测算法建模精度有很大干扰,使得最后的检测结果中出现很多错误的前景目标,而语义分割对这些干扰因素有很好的鲁棒性,因此可以借助语义分割与前景目标检测算法进行交互,帮助前景检测算法“剔除”这些干扰因素,从而得到更精确的前景检测结果。实验结果表明本文算法优于目前几乎所有的无监督型前景目标检测算法,同时还能达到实时性要求。4)提出了一种基于卷积神经网络的前景目标检测结果融合策略。近年来学术界、工业界提出了各种前景目标检测算法,但是各种算法都有各自的优势、劣势,很少有算法能同时处理监控场景中出现的各种干扰因素。因此,有研究人员考虑将各种算法结果进行融合,充分发挥不同算法的优势,出现了基于遗传算法、多数投票等算法的前景检测结果融合策略。本文提出一种全卷积编码-解码网络结构用于前景目标检测结果融合,将多种前景目标检测算法的结果输入到网络中,生成更精确的前景检测结果。实验结果表明本文提出的融合策略优于其他融合策略。
【学位单位】:中国科学院大学(中国科学院长春光学精密机械与物理研究所)
【学位级别】:博士
【学位年份】:2019
【中图分类】:TN948.6
【部分图文】:
第1章 绪论第1章 绪论1.1研究背景及意义近年来,随着计算机、通信、传感器以及多媒体等技术的快速发展,信息的获取速度和获取量成几何级数递增,可以说,人类正处于一个信息大爆炸的时代。计算机视觉的研究目的是利用计算机模拟人类的视觉系统,使得计算机具有视觉信息摄入能力、信息分析能力以及决策制定能力,从而在某些应用场景中替代人工操作,节省人工成本。因此,近年来计算机视觉相关的研究得到极大的重视和快速的发展,并且在视频监控、工业生产、医疗诊断、自动驾驶、智慧城市以及智能支付等众多领域得到广泛应用,取得了巨大的经济效益与社会效益[1–4]。
图1.2智能视频监控系统流程[6]分析和理解,并根据预设规则输出分析结果。概括起来,智能视频监控系统的主要目的就是要让计算机回答当前场景兴趣目标在哪里,是什么,在干什么等。从智能视频监控系统流程可以看出,底层的兴趣目标提取过程是整个监控系统基础部分,是后续目标跟踪、目标识别及行为分析等任务的重要基础,其性能的好坏直接影响了后续目标任务的性能。本文将这个兴趣目标的提取过程称为“前景目标检测”。很多文献中[10–13]也将该过程称为“运动目标检测”,然而实际监控场景中运动的目标不一定是兴趣目标,比如摇曳的树木、水面(海面)波纹、喷泉、运动的扶梯等等;而且还有很多情况下静止的目标也可能属于兴趣目标,比如故意丢弃的(危险)物品都属于兴趣目标,因此本文主要使用“前景目标检测”这一学术名词。前景目标检测是计算机视觉领域的研究热点之一,其应用领域不仅仅局限于智能视频监控,在人机交互、军事、多媒体等领域都具有广泛应用:
第1章 绪论机场、火车站等人流密集场景监控[14,15]。(2)人机交互:新一代的人机交互系统可以实时准确地检测识别肢体动作信息,然后迅速地响应相应操作,相较于传统的键盘鼠标的交互方式,新一代的人机交互方式更加便捷高效。典型的代表应用有微软的Kinect、谷歌的GoogleGlass、体感游戏等[16–18]。
【参考文献】
本文编号:2871890
【学位单位】:中国科学院大学(中国科学院长春光学精密机械与物理研究所)
【学位级别】:博士
【学位年份】:2019
【中图分类】:TN948.6
【部分图文】:
第1章 绪论第1章 绪论1.1研究背景及意义近年来,随着计算机、通信、传感器以及多媒体等技术的快速发展,信息的获取速度和获取量成几何级数递增,可以说,人类正处于一个信息大爆炸的时代。计算机视觉的研究目的是利用计算机模拟人类的视觉系统,使得计算机具有视觉信息摄入能力、信息分析能力以及决策制定能力,从而在某些应用场景中替代人工操作,节省人工成本。因此,近年来计算机视觉相关的研究得到极大的重视和快速的发展,并且在视频监控、工业生产、医疗诊断、自动驾驶、智慧城市以及智能支付等众多领域得到广泛应用,取得了巨大的经济效益与社会效益[1–4]。
图1.2智能视频监控系统流程[6]分析和理解,并根据预设规则输出分析结果。概括起来,智能视频监控系统的主要目的就是要让计算机回答当前场景兴趣目标在哪里,是什么,在干什么等。从智能视频监控系统流程可以看出,底层的兴趣目标提取过程是整个监控系统基础部分,是后续目标跟踪、目标识别及行为分析等任务的重要基础,其性能的好坏直接影响了后续目标任务的性能。本文将这个兴趣目标的提取过程称为“前景目标检测”。很多文献中[10–13]也将该过程称为“运动目标检测”,然而实际监控场景中运动的目标不一定是兴趣目标,比如摇曳的树木、水面(海面)波纹、喷泉、运动的扶梯等等;而且还有很多情况下静止的目标也可能属于兴趣目标,比如故意丢弃的(危险)物品都属于兴趣目标,因此本文主要使用“前景目标检测”这一学术名词。前景目标检测是计算机视觉领域的研究热点之一,其应用领域不仅仅局限于智能视频监控,在人机交互、军事、多媒体等领域都具有广泛应用:
第1章 绪论机场、火车站等人流密集场景监控[14,15]。(2)人机交互:新一代的人机交互系统可以实时准确地检测识别肢体动作信息,然后迅速地响应相应操作,相较于传统的键盘鼠标的交互方式,新一代的人机交互方式更加便捷高效。典型的代表应用有微软的Kinect、谷歌的GoogleGlass、体感游戏等[16–18]。
【参考文献】
相关期刊论文 前6条
1 冯学强;张良旭;刘志宗;;无人驾驶汽车的发展综述[J];山东工业技术;2015年05期
2 尹宝才;王文通;王立春;;深度学习研究综述[J];北京工业大学学报;2015年01期
3 黄凯奇;陈晓棠;康运锋;谭铁牛;;智能视频监控技术综述[J];计算机学报;2015年06期
4 刘丽;匡纲要;;图像纹理特征提取方法综述[J];中国图象图形学报;2009年04期
5 郑世宝;;智能视频监控技术与应用[J];电视技术;2009年01期
6 葛继科;邱玉辉;吴春明;蒲国林;;遗传算法研究综述[J];计算机应用研究;2008年10期
本文编号:2871890
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2871890.html