深度神经网络视频异常目标检测与定位算法研究
发布时间:2021-10-19 05:47
在智能化深入普及和公共安全被高度重视的今天,人们对于智能视频监控系统尤其是具有实现实时性海量视频数据处理能力的智能监控系统有迫切需求,视频异常检测技术持续成为图像处理、机器视觉的研究重点与热点,且在社会生活中发挥着越来越重要的作用。针对视频监控系统对于实时性视频大数据处理能力的需求,该文在深度学习卷积神经网络基础上,对监控视频中异常目标的检测和定位进行了研究,主要研究内容包括以下几点:首先,针对拥挤场景下的异常目标检测与定位问题,提出基于并联双流三维卷积神经网络的视频监控异常目标检测与定位算法。针对视频序列中大量背景信息及有效信息分布不均匀的情况,采用光流结合非均匀的细胞分割对视频的运动目标进行提取并得到空间尺寸大小不同的时空兴趣块。针对不同异常动作被学习识别所需时间不同,采用并联双流三维卷积神经网络分别从7帧和3帧两种帧长度兴趣块进行学习,最后通过对不同帧长时空兴趣块异常判别结果的融合得到最终异常检测结果。其次,为提高异常检测算法对数据的自适应能力,降低对应用场景具有局限性,提出时空深度特征近邻传播聚类算法(Affinity Propagation Clustering,AP)的稀疏...
【文章来源】:燕山大学河北省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
视频异常检测数据库正常及异常帧示例
{0yY 非均匀细胞分割单元格结构设置原理示意络表示提供了新思路,例如文献[29]提息和视频序列的光流图在同一网络结依旧是基于手工特征,在一定程度上3D 获得视频连续帧的时空特征,C3D信息进行卷积操作,符合视频本身的征。
第 4 章 时空深度特征 AP 聚类的稀疏表示视频监控异常目标检测与定位算法二维图像的空间深度特征还包含对于速度等进行描述的时域特征,也就是说特征从时间域和空间域同时对视频块进行描述和表示,因此对视频信息的表示更为准确。在视频异常检测中,异常种类多样,不同的异常动作被识别需要的时间不同。过于短时间会导致动作表示不充分,但过长的时间不仅使得视频块包含的信息种类过多从而影响异常的检测还会造成网络训练时较高的数据存储代价和运行时间代价。因此,本方法采用时长为 K=7 帧的时空兴趣块对不同的行为进行描述,在学习时空兴趣块完整的时空特征的同时,保证运动目标动作的准确表示。采用的网络框架是基于 VGG-16 的 C3D 框架,这一框架中每个卷积层都进行边缘扩充(Pad),保证卷积操作的输入输出大小尺寸相同。网络框图如下图 4-2 所示。本异常检测方法所采用的C3D 网络中,所有的池化层都采用最大值池化方式。在进行 CNN 训练时在网络结构中采用 卷积核实现对视频序列的描述。
本文编号:3444269
【文章来源】:燕山大学河北省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
视频异常检测数据库正常及异常帧示例
{0yY 非均匀细胞分割单元格结构设置原理示意络表示提供了新思路,例如文献[29]提息和视频序列的光流图在同一网络结依旧是基于手工特征,在一定程度上3D 获得视频连续帧的时空特征,C3D信息进行卷积操作,符合视频本身的征。
第 4 章 时空深度特征 AP 聚类的稀疏表示视频监控异常目标检测与定位算法二维图像的空间深度特征还包含对于速度等进行描述的时域特征,也就是说特征从时间域和空间域同时对视频块进行描述和表示,因此对视频信息的表示更为准确。在视频异常检测中,异常种类多样,不同的异常动作被识别需要的时间不同。过于短时间会导致动作表示不充分,但过长的时间不仅使得视频块包含的信息种类过多从而影响异常的检测还会造成网络训练时较高的数据存储代价和运行时间代价。因此,本方法采用时长为 K=7 帧的时空兴趣块对不同的行为进行描述,在学习时空兴趣块完整的时空特征的同时,保证运动目标动作的准确表示。采用的网络框架是基于 VGG-16 的 C3D 框架,这一框架中每个卷积层都进行边缘扩充(Pad),保证卷积操作的输入输出大小尺寸相同。网络框图如下图 4-2 所示。本异常检测方法所采用的C3D 网络中,所有的池化层都采用最大值池化方式。在进行 CNN 训练时在网络结构中采用 卷积核实现对视频序列的描述。
本文编号:3444269
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3444269.html
最近更新
教材专著