基于深度学习的红外行为检测方法研究
发布时间:2021-01-17 19:15
行为检测旨在通过智能算法自动地定位视频中感兴趣行为,并判断行为的类别。行为检测是计算机视觉研究领域一项极其重要且困难的研究任务,其研究成果可被广泛应用于智能监控系统、海量视频检索、机器人视觉、非法视频检索等领域。本文针对现有基于深度学习的行为检测方法中特征提取网络的表达能力不足和对行为构成的建模不足等问题展开研究,具体研究工作如下:首先,本文构建了一个红外行为检测数据集,以弥补由于缺少红外行为检测数据集而引起的红外行为检测研究空白。该红外检测数据集覆盖不同角度、光照等多个场景,能够很好地模拟真实环境。同时,介绍了两种常用于可见光视频数据的深度学习行为检测框架,以便本文展开基于深度学习行为检测的研究。其次,行为识别是行为检测的核心模块,而现有行为识别方法中特征提取网络存在学习能力不足的问题。为此,本文提出了一种基于多级平衡特征金字塔的红外行为识别方法,并将其应用于后续的行为检测方法中。传统的卷积神经网络往往不断加深网络层来获取更好的表达能力,忽略了对浅层特征的运用。本文提出的方法使用并行的卷积块来构成特征金字塔以保持不同分辨率的特征。同时,使用相同深度的语义特征产生特征金字塔,以此来达到...
【文章来源】:重庆邮电大学重庆市
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
光照变化对红外
重庆邮电大学硕士学位论文第2章红外行为检测数据集及相关技术基础9(a)没有遮挡(b)适度遮挡(c)重度遮挡(d)场景1(e)场景2(f)场景3(g)场景4(h)场景5(i)场景6图2.2“打架”行为示例图不同遮挡程度:拍摄行为有考虑到不同程度地遮挡,每个行为拍摄了从0%到90%的不同程度遮挡的视频片段。这提高了红外行为检测数据集的多样性,如图2.2(a)-(c)所示。场景复杂度:数据集包含从相对简单的场景(仅包含执行行为的人)到复杂的场景(多个非相关行为人流动)不等。对于简单场景只有相关执行行为人,如图2.2(d)-(i)所示。而对于复杂的场景,拥有多个非相关行为人或车辆,如图2.2(g)和图2.2(h)所示。光照变换:众所周知红外光谱受光照变化影响较小,为了突显红外数据的优势,本文拍摄了不同光照程度的视频。从图2.1(a)-(b)可以看出光照对红外成像的影响较小,不论是白天还是黑夜都能获得比较好的成像效果。2.3基于深度学习的行为检测相关技术基础自2012年由Hinton和Alex提出的AlexNet[37]神经网络在国际型比赛ImageNet上摘得桂冠以来,深度卷积网络在学术界和工业界引起了广泛地关注,成为了人工
见光数据和红外数据特征低层特征相对完整,但是高层特征相比与可见光数据有明显缺失。这将导致现成的可见光成像行为识别网络对红外行为识别的性能不佳。所以,当通过深度学习网络学习红外数据的特征时,保持红外数据的低层特征信息对于红外行为识别来说至关重要。 (a) 可见光数据
【参考文献】:
期刊论文
[1]融合视频时空域运动信息的3D CNN人体行为识别[J]. 刘嘉莹,张孙杰. 电子测量技术. 2018(07)
[2]A Survey of Image Synthesis and Editing with Generative Adversarial Networks[J]. Xian Wu,Kun Xu,Peter Hall. Tsinghua Science and Technology. 2017(06)
本文编号:2983445
【文章来源】:重庆邮电大学重庆市
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
光照变化对红外
重庆邮电大学硕士学位论文第2章红外行为检测数据集及相关技术基础9(a)没有遮挡(b)适度遮挡(c)重度遮挡(d)场景1(e)场景2(f)场景3(g)场景4(h)场景5(i)场景6图2.2“打架”行为示例图不同遮挡程度:拍摄行为有考虑到不同程度地遮挡,每个行为拍摄了从0%到90%的不同程度遮挡的视频片段。这提高了红外行为检测数据集的多样性,如图2.2(a)-(c)所示。场景复杂度:数据集包含从相对简单的场景(仅包含执行行为的人)到复杂的场景(多个非相关行为人流动)不等。对于简单场景只有相关执行行为人,如图2.2(d)-(i)所示。而对于复杂的场景,拥有多个非相关行为人或车辆,如图2.2(g)和图2.2(h)所示。光照变换:众所周知红外光谱受光照变化影响较小,为了突显红外数据的优势,本文拍摄了不同光照程度的视频。从图2.1(a)-(b)可以看出光照对红外成像的影响较小,不论是白天还是黑夜都能获得比较好的成像效果。2.3基于深度学习的行为检测相关技术基础自2012年由Hinton和Alex提出的AlexNet[37]神经网络在国际型比赛ImageNet上摘得桂冠以来,深度卷积网络在学术界和工业界引起了广泛地关注,成为了人工
见光数据和红外数据特征低层特征相对完整,但是高层特征相比与可见光数据有明显缺失。这将导致现成的可见光成像行为识别网络对红外行为识别的性能不佳。所以,当通过深度学习网络学习红外数据的特征时,保持红外数据的低层特征信息对于红外行为识别来说至关重要。 (a) 可见光数据
【参考文献】:
期刊论文
[1]融合视频时空域运动信息的3D CNN人体行为识别[J]. 刘嘉莹,张孙杰. 电子测量技术. 2018(07)
[2]A Survey of Image Synthesis and Editing with Generative Adversarial Networks[J]. Xian Wu,Kun Xu,Peter Hall. Tsinghua Science and Technology. 2017(06)
本文编号:2983445
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2983445.html
最近更新
教材专著