基于深度学习的智能视频监控中的关键技术研究
发布时间:2020-12-10 02:39
计算机视觉是人工智能领域一个重要的研究方向,通过各种传感器设备来记录真实世界并通过图像、视频等原始形式进行信息表达,利用计算机从原始的视频数据中提取出符合人类认知的语义理解,即让计算机能和人一样自动分析和理解视频数据。比如,判断场景中有哪些感兴趣目标,通过物体历史运动轨迹预测未来行走方向,识别危险目标和动作,以及分析目标之间的关系等。智能视频监控技术是利用计算机视觉和数字图像处理相关的方法对各种设备拍摄的图像或者视频序列进行处理、分析和理解。智能视频监控技术在民用和军事领域都有极大的应用背景,如智慧城市建设、公共安全管理以及军事建设等。单目标视频跟踪是智能视频监控中的关键环节,在一些安全系数高的场合,能够对进入场景中的人员进行实时跟踪,并在跟踪过程中识别目标的行为,这就引出了多场景下的行为识别这一技术。多场景下的行为识别技术能够对捕捉到的人物的行为进行类别判定,提示系统在必要情况下进行警报处理。对于不同摄像机记录的行人,多摄像头下的行人再识别技术能够准确定位到每一个待查询目标行人,在一定程度上避免了误判和漏判。为了进一步提高智能视频监控的可靠性和实时性,本文对智能视频监控中的单目标视频...
【文章来源】:上海大学上海市 211工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
AMDNet算法模型的网络结构
大学硕士学位论文中每个分支都包含一个二分类器,通过学习不同组的视频序列获景的能力。了进一步了解本章设计的卷积神经网络模型,使用 DeepDraw 工中的两个卷积层进行可视化操作。结果如图 2-3 所示,(a)图已经,形状和轮廓,(b)图比(a)图具有更加清晰的轮廓,在特征表达上映了后续卷积层比前面的卷积层在表达上更加细致,对图像的把
认为是有效聚类簇。在有效聚类簇中,选择靠近聚类簇中心的帧作为候选视频关键帧。然而,即使从有效聚类簇中选择候选帧,仍存在冗余问题。为了避免关键帧的内容相似度过高,使用1 2{f ,f ,...,f }n描述候选关键帧,如果if 和i1f 的相似度小于设定的阈值 ,则移除第 i 1帧。2.3.2 基于相似度的视频分组算法AMDNet 模型的主干层学习视频序列的共性特征,分支层对同一类别的目标和背景进行识别。在训练时,为了区别不同类别的目标和背景,对视频训练集分组,每组对应一个分支。本章提出基于相似度的视频分组算法,利用 2.3.1 得到的关键帧表达各个视频序列,算法流程如图 2-5 所示,主要步骤总结为算法 2-1。使用1 2 3{q ,q ,q ,...,q }n表示一个训练视频集,首先进行分组的初始化操作。设置组内最大视频成员数量为 M ,将第一个训练视频序列1q 置入第一组即1g ,定义组成员数量1| g |,且初始化其值为 1,组别数目total= 1。
本文编号:2907937
【文章来源】:上海大学上海市 211工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
AMDNet算法模型的网络结构
大学硕士学位论文中每个分支都包含一个二分类器,通过学习不同组的视频序列获景的能力。了进一步了解本章设计的卷积神经网络模型,使用 DeepDraw 工中的两个卷积层进行可视化操作。结果如图 2-3 所示,(a)图已经,形状和轮廓,(b)图比(a)图具有更加清晰的轮廓,在特征表达上映了后续卷积层比前面的卷积层在表达上更加细致,对图像的把
认为是有效聚类簇。在有效聚类簇中,选择靠近聚类簇中心的帧作为候选视频关键帧。然而,即使从有效聚类簇中选择候选帧,仍存在冗余问题。为了避免关键帧的内容相似度过高,使用1 2{f ,f ,...,f }n描述候选关键帧,如果if 和i1f 的相似度小于设定的阈值 ,则移除第 i 1帧。2.3.2 基于相似度的视频分组算法AMDNet 模型的主干层学习视频序列的共性特征,分支层对同一类别的目标和背景进行识别。在训练时,为了区别不同类别的目标和背景,对视频训练集分组,每组对应一个分支。本章提出基于相似度的视频分组算法,利用 2.3.1 得到的关键帧表达各个视频序列,算法流程如图 2-5 所示,主要步骤总结为算法 2-1。使用1 2 3{q ,q ,q ,...,q }n表示一个训练视频集,首先进行分组的初始化操作。设置组内最大视频成员数量为 M ,将第一个训练视频序列1q 置入第一组即1g ,定义组成员数量1| g |,且初始化其值为 1,组别数目total= 1。
本文编号:2907937
本文链接:https://www.wllwen.com/kejilunwen/wltx/2907937.html