视频监控中的目标计数方法研究
发布时间:2020-09-17 17:25
随着社会经济的飞速发展,公共安全已经成为全民关注的热点问题,视频监控技术随之得到了广泛的普及。如今,智能视频监控系统已经大量应用在交通路口、火车站、机场、大型商场、广场等公共场所。作为智能视频监控领域中的重要内容,目标计数在实际生活中有着大量的应用场景,准确的估计出目标在图像中的具体数目是相关任务的关键。在智能交通系统中,准确的估计出交通场景中的车辆数目可以为交通管理部门进行公共交通管理提供重要依据;统计商场的客流量信息可以帮助商家进行科学的资源分配;对大型公共场所的人群密度进行监控可以及时发现安全隐患并提供预警。计数任务的目标是让计算机准确的估计出图像中的相关物体数量。根据应用数据来源的不同,可以将目标计数任务分为视频中的目标计数和单一图片中的目标计数。本文分别针对这两方面进行了深入研究,根据实际应用场景的不同特性,分析了已有算法所存在的问题,提出了具有针对性的目标计数算法。本文的主要研究工作和贡献可概括如下:1)针对视频中的目标计数问题,本文重点考虑交通视频中的车辆计数问题。目前,基于视频图像的目标计数算法大多是在像素域中进行的,像素域中包含丰富的可提取信息,可以取得较为精确的计数结果。然而,在实际监控系统中,监控视频数据一般是以压缩的形式进行传输和储存的,像素域处理方法需要先将压缩域数据完全解压之后才能进行,算法复杂度高。对此,本文提出了一种直接在压缩域视频中进行车辆计数的方法。首先,为了解决压缩域中的信息不足和噪声干扰问题,提出了多样化的丰富特征提取方法,充分利用了压缩视频流中的运动矢量和宏块编码模式信息。其次,针对实际交通场景复杂多变的特性,提出了一种基于分层分类的回归模型来进行车辆计数,将复杂场景逐步细化,并采用特定模型实现精确计数。最后,在实际交通数据集上的结果表明,所提压缩域算法不仅能达到更高的运行效率,同时在精度上与传统像素域方法也有着相当的表现。2)相比于像素域处理,压缩域本身存在着信息量不足以及噪声干扰的问题,仅在单独一帧上进行回归计数难以保证结果的稳定性。为了解决这个问题,本文提出了 一种基于空间与时间回归的压缩域车辆计数模型。具体来说,先通过空间维度回归在单一视频帧上进行车辆数目估计,再利用目标数量在时间维度上的连续性约束信息建立时间维度上的回归模型,学习车辆密度在局部时间序列上的变化模式,对空间回归的计数结果进一步优化,实现更加精确的压缩域计数。在实际交通数据集上的结果证明了所提压缩域算法的有效性。3)针对单一图片中的目标计数问题,本文提出了一种基于深度卷积神经网络的目标计数框架,利用卷积神经网络模型强大的非线性建模能力进行目标计数。该方法直接学习从原始图片到目标密度分布图的映射,为每个像素点分配一个对应的密度值,图片中各个区域的目标数目可以通过对密度图直接积分得到。为了提高模型的鲁棒性,提出采用空间金字塔池化方法对提取的深度模型特征进行鲁棒性增强,得到了更好的特征表示。此外,为了生成更好的目标密度分布图,提出了一种金字塔分层计数模型,充分利用了卷积神经网络模型中固有的多层级金字塔结构,进一步提高了模型性能。在多个代表性数据集上的实验结果验证了所提算法的有效性。总结起来,本文针对视频监控场景中的目标计数问题进行了深入探索和研究,结合实际应用场景的具体特性,提出了两类目标计数框架,即压缩域视频中的目标计数框架和基于卷积神经网络的金字塔计数网络框架。多个典型数据集上的实验证明,本文在提高目标计数方法的实时性和鲁棒性等方面取得了很好的效果,相较于已有算法均取得了明显进步,展示了其实际应用价值。
【学位单位】:中国科学技术大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:TN948.6
【部分图文】:
Lempitsky等[23]在2010年开创性地提出了基于密度估计的目标计数算法逡逑框架。该方法首先利用手工标注的目标中心点图生成目标密度分布真值图像集。逦’逡逑如图1.2a和1.2c所示,在行人的身体中间部位或者头部用点标记行人位置,将标逡逑注的二值点图中目标中心位置作为高斯核的中心,通过高斯滤波赋予周边像素逡逑相应的密度值,当目标分布比较密集时,其周边像素的密度值为多个高斯核对应逡逑值的叠加。二值点图经过高斯滤波后,生成如图1.2b和1.2d所示的密度分布图。逡逑然后以密度分布真值图像集为训练集,在原图像各像素点位置提取图片特征,训逡逑练回归模型,直接学习从像素点特征到图像密度分布图的映射关系。最后,得到逡逑的密度分布图反应了场景中的目标分布情况,且通过区域密度求和就能得到任逡逑意区域的目标数目。该方法有效的利用了目标在图像中的空间分布特性,从而实逡逑现很好的预测。在此基础上
基于区域回归的计数方法并不要求精确检测出每个待统计目标在图像中的逡逑具体位置,这类方法更关心的是场景中的目标总数,通过建立区域图像特征与区逡逑域目标数量的回归模型来直接估计场景中的目标总数。如图2.1所示,本文对基逡逑于区域回归的计数模型采用的经典框架进行了总结和概括。典型的区域回归方逡逑法主要包括四个核心部分:前景区域分割、透视校正、区域特征提取、基于特征逡逑的回归计数。逡逑给定一张计数场景图像,一般首先分割出场景中的前景部分,并根据场景视逡逑角对分割后的前景区域进行透视校正,然后提取与目标数目相关的区域特征,例逡逑如前景区域像素统计特征、边缘特征、纹理特征和特征点等,最后通过回归模型逡逑学习区域特征到区域目标总数之间的映射关系。接下来将在各节中总结各模块逡逑的典型处理思路和方法。逡逑r邋成:逡逑'1逦°o邋—?<) ̄ ̄*00 ̄?00 ̄eoo邋ioco邋i.xo^ixT邋iboo邋tsar:邋?000逡逑I逦^邋预灥逡逑pp^j逦?邋~|逡逑图2.1基于区域回归的计数算法总体框架逡逑2.4.2前景区域分割逡逑前景分割的主要目的是在给定的图像中将前景区域从背景中分离出来。前逡逑景提取的准确性和完整性会直接影响到计数结果的准确率,是后续进一步处理的逡逑重要基础。在目标计数方法中,前景分割的常用算法有两种:混合高斯模型[49]逡逑和混合动态纹理模型[50]。逡逑2.4.2.1混合高斯模型逡逑混合高斯模型(Gaussian邋Mixture邋Model,邋GMM)邋[49]是一^t"非常经典的背景逡逑建模算法,能够描述复杂的场景,且算法复杂度
(b)逡逑图2.2逦(a)动态纹理模型,(b)混合动态纹理模型逡逑K邋?iV(0,邋Q),岣?7V(0,邋i?),<5邋e/2mx'邋i?邋#嶝浚恚
本文编号:2821002
【学位单位】:中国科学技术大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:TN948.6
【部分图文】:
Lempitsky等[23]在2010年开创性地提出了基于密度估计的目标计数算法逡逑框架。该方法首先利用手工标注的目标中心点图生成目标密度分布真值图像集。逦’逡逑如图1.2a和1.2c所示,在行人的身体中间部位或者头部用点标记行人位置,将标逡逑注的二值点图中目标中心位置作为高斯核的中心,通过高斯滤波赋予周边像素逡逑相应的密度值,当目标分布比较密集时,其周边像素的密度值为多个高斯核对应逡逑值的叠加。二值点图经过高斯滤波后,生成如图1.2b和1.2d所示的密度分布图。逡逑然后以密度分布真值图像集为训练集,在原图像各像素点位置提取图片特征,训逡逑练回归模型,直接学习从像素点特征到图像密度分布图的映射关系。最后,得到逡逑的密度分布图反应了场景中的目标分布情况,且通过区域密度求和就能得到任逡逑意区域的目标数目。该方法有效的利用了目标在图像中的空间分布特性,从而实逡逑现很好的预测。在此基础上
基于区域回归的计数方法并不要求精确检测出每个待统计目标在图像中的逡逑具体位置,这类方法更关心的是场景中的目标总数,通过建立区域图像特征与区逡逑域目标数量的回归模型来直接估计场景中的目标总数。如图2.1所示,本文对基逡逑于区域回归的计数模型采用的经典框架进行了总结和概括。典型的区域回归方逡逑法主要包括四个核心部分:前景区域分割、透视校正、区域特征提取、基于特征逡逑的回归计数。逡逑给定一张计数场景图像,一般首先分割出场景中的前景部分,并根据场景视逡逑角对分割后的前景区域进行透视校正,然后提取与目标数目相关的区域特征,例逡逑如前景区域像素统计特征、边缘特征、纹理特征和特征点等,最后通过回归模型逡逑学习区域特征到区域目标总数之间的映射关系。接下来将在各节中总结各模块逡逑的典型处理思路和方法。逡逑r邋成:逡逑'1逦°o邋—?<) ̄ ̄*00 ̄?00 ̄eoo邋ioco邋i.xo^ixT邋iboo邋tsar:邋?000逡逑I逦^邋预灥逡逑pp^j逦?邋~|逡逑图2.1基于区域回归的计数算法总体框架逡逑2.4.2前景区域分割逡逑前景分割的主要目的是在给定的图像中将前景区域从背景中分离出来。前逡逑景提取的准确性和完整性会直接影响到计数结果的准确率,是后续进一步处理的逡逑重要基础。在目标计数方法中,前景分割的常用算法有两种:混合高斯模型[49]逡逑和混合动态纹理模型[50]。逡逑2.4.2.1混合高斯模型逡逑混合高斯模型(Gaussian邋Mixture邋Model,邋GMM)邋[49]是一^t"非常经典的背景逡逑建模算法,能够描述复杂的场景,且算法复杂度
(b)逡逑图2.2逦(a)动态纹理模型,(b)混合动态纹理模型逡逑K邋?iV(0,邋Q),岣?7V(0,邋i?),<5邋e/2mx'邋i?邋#嶝浚恚
本文编号:2821002
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2821002.html