基于深度学习的视频人数统计
发布时间:2023-12-29 18:47
视频人数统计是计算机视觉的重要应用,在公共安防和人群引流等领域具有重要意义。但是由于视频监控中的场景往往复杂多样,所以传统视频人数统计方法的精度和鲁棒性都不高。深度学习具有强大的特征提取能力、非线性表达能力和泛化能力,因此本文从深度学习入手,研究设计基于深度学习算法的视频人数统计。本文的研究针对二种监控视频场景:第一种是自上而下的俯视视角的视频,这种场景常出现在建筑物出入口或电梯;第二种是倾斜向下的斜射式监控视频,这种场景常出现在路边或商场等公共场所内部。本文分别针对这两种视频的特点,提出了基于行人检测和基于人群密度图的两种深度学习的人数统计算法。基于行人检测的人数统计:在第一种场景中,视频覆盖的范围较小,人数较少,绝大多数行人都清晰可见,易检出。但行人的头部和肩部是主要特征,目标较小。而且与行人语义相关的行人属性(即行人携带的物品:如背包、帽子等)容易导致误检和漏检。深度学习虽然在目标检测领域取得很大的成就,但是目前还没有一种深度学习算法对小目标鲁棒。针对这些问题,本文提出一种联合语义的深度学习行人检测方法:首先改进深度神经网络对小目标的辨别力,然后把容易造成误检和漏检的行人语义属性...
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 基于检测的人数统计
1.2.2 基于回归的人数统计
1.2.3 基于深度学习的人数统计
1.3 现有技术存在的问题
1.4 主要工作和论文结构
1.4.1 本文主要工作
1.4.2 本文组织结构
第二章 深度学习的相关知识
2.1 深度神经网络
2.1.1 网络结构
2.1.2 激活函数
2.1.3 损失函数
2.1.4 反向传播算法
2.1.5 优化方法
2.2 卷积神经网络
2.2.1 卷积
2.2.2 池化
2.3 区域卷积神经网络
2.4 深度残差网络
2.5 Inception网络
2.6 本文研究设计总体思路
2.7 本章小节
第三章 基于行人检测的人数统计
3.1 数据集制作
3.2 小目标检测
3.2.1 更快速区域卷积神经网络(Faster R-CNN)
3.2.2 基于Faster R-CNN的行人检测
3.3 行人与语义属性的聚合
3.4 联合语义的人数统计
3.4.1 训练行人及语义属性检测器
3.4.2 行人检测与统计人数
3.5 实验与评估
3.6 本章小结
第四章 基于人群密度图的人数统计
4.1 人群数据集
4.1.1 公开数据集
4.1.2 数据增广
4.2 人群密度图
4.2.1 基于固定高斯分布的人群密度图
4.2.2 基于透视图的人群密度图
4.2.3 基于自适应高斯核的人群密度图
4.2.4 标签人群密度图的制作
4.3 网络结构设计
4.3.1 本文网络结构的设计准则
4.3.2 多尺度适应性的高性能网络结构设计
4.4 离线训练网络
4.5 在线统计人数
4.6 实验与评估
4.7 本章小结
第五章 帧间结果修正
5.1 修正算法
5.2 阈值ε的确定和更新
5.2.1 阈值ε的确定
5.2.2 阈值ε的更新
5.3 修正实验
5.4 本章小结
结论
参考文献
致谢
个人简历
在学期间的研究成果及发表的学术论文
【部分图文】:
第5章基于深度学习视频分析技术的人数统计算法-39-5.3基于深度学习视频分析技术的人数统计算法优化5.3.1人数统计算法主要问题上述算法的设计主要是基于视频连续性强时trackid基本保持不变的前提,然而本系统由于性能受限,为了更好地达到实时性,做了跳帧处理,导致视频的连续性较....
以解决上述存在的问题,这对于基于视频的人数统计技术和基于视频图像的智能现代安防的发展具有深远的研究意义。图1-2 多样化室外监控场景
本文编号:3876232
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 基于检测的人数统计
1.2.2 基于回归的人数统计
1.2.3 基于深度学习的人数统计
1.3 现有技术存在的问题
1.4 主要工作和论文结构
1.4.1 本文主要工作
1.4.2 本文组织结构
第二章 深度学习的相关知识
2.1 深度神经网络
2.1.1 网络结构
2.1.2 激活函数
2.1.3 损失函数
2.1.4 反向传播算法
2.1.5 优化方法
2.2 卷积神经网络
2.2.1 卷积
2.2.2 池化
2.3 区域卷积神经网络
2.4 深度残差网络
2.5 Inception网络
2.6 本文研究设计总体思路
2.7 本章小节
第三章 基于行人检测的人数统计
3.1 数据集制作
3.2 小目标检测
3.2.1 更快速区域卷积神经网络(Faster R-CNN)
3.2.2 基于Faster R-CNN的行人检测
3.3 行人与语义属性的聚合
3.4 联合语义的人数统计
3.4.1 训练行人及语义属性检测器
3.4.2 行人检测与统计人数
3.5 实验与评估
3.6 本章小结
第四章 基于人群密度图的人数统计
4.1 人群数据集
4.1.1 公开数据集
4.1.2 数据增广
4.2 人群密度图
4.2.1 基于固定高斯分布的人群密度图
4.2.2 基于透视图的人群密度图
4.2.3 基于自适应高斯核的人群密度图
4.2.4 标签人群密度图的制作
4.3 网络结构设计
4.3.1 本文网络结构的设计准则
4.3.2 多尺度适应性的高性能网络结构设计
4.4 离线训练网络
4.5 在线统计人数
4.6 实验与评估
4.7 本章小结
第五章 帧间结果修正
5.1 修正算法
5.2 阈值ε的确定和更新
5.2.1 阈值ε的确定
5.2.2 阈值ε的更新
5.3 修正实验
5.4 本章小结
结论
参考文献
致谢
个人简历
在学期间的研究成果及发表的学术论文
【部分图文】:
结合全局特征Softmax分类图2-8 全局上下文网络结构示意图2.3.3 困难样本在线挖掘在上述 Faster R-CNN 算法介绍中,目标检测过程的最小批量采样使用随机采样,而随机采样无疑会出现收敛速度慢并且模型无法达到最优化的问题。针对此问题,拟采用困难样本挖掘的方法优化算....
本文编号:3876232
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3876232.html