当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的监控行人检测

发布时间:2023-11-04 13:19
  行人检测是计算机视觉与模式识别方向一个重要的研究领域,在智能交通、智能视频监控、无人驾驶以及智能机器人等领域有着巨大的应用前景。例如视频监控中关注的行人的运动轨迹和行为,要实现对行人跟踪和行为分析,首先要做的就是检测出视频中的行人。传统的行人检测解决方案主要基于统计分类的方法,通过手工设计类内差异小、类间差异大的特征并训练分类器,从而将检测问题转化为人与非人的二分类问题,目前常用特征包括梯度直方图(HOG)和尺度不变特征转换(SIFT)。但是通常这些手工设计的特征并不具备强大的表征能力,在鲁棒性上有一定的局限性,并且设计这些特征需要扎实的专业基础。近几年来,深度学习(Deep Learning,简称DL)被广泛的应用于计算机视觉相关问题中,并取得了巨大的成功。DL利用卷积神经网络(Convolutional Neural Network,简称CNN)自动学习出目标的特征,并且这种特征具备很强的鲁棒性。本文将基于深度学习算法进行行人检测算法的研究,旨在提高对小尺度行人的检测精度。本文主要的创新点如下:(1)利用CNN的结构特点,对上下文信息进行建模,实现尺度自适应上下文信息的行人检测模型...

【文章页数】:81 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 课题背景及意义
    1.2 国内外研究现状
    1.3 行人检测的技术难点
    1.4 本文主要内容
    1.5 本文章节安排
第二章 深度学习算法与行人检测概述
    2.1 深度学习理论基础
        2.1.1 深度学习概述
        2.1.2 卷积神经网络
        2.1.3 基于深度学习的目标检测算法
        2.1.4 深度学习主流框架
    2.2 行人检测关键技术介绍
        2.2.1 行人检测算法常用的数据集
        2.2.2 行人检测算法的评价指标
        2.2.3 传统行人特征检测子
        2.2.4 基于深度学习的行人检测算法
    2.3 本章小结
第三章 基于尺度自适应上下文的行人检测建模
    3.1 引言
    3.2 图像金字塔
        3.2.1 图像金字塔的原理
        3.2.2 稀疏图像金字塔
    3.3 基于k-medoids模板聚类
        3.3.1 k-medoids基本原理
        3.3.2 k-medoids模板聚类
    3.4 尺度自适应的上下文信息
        3.4.1 上下文信息
        3.4.2 CNN感受野的概念
        3.4.3 尺度自适应的上下文信息建模
    3.5 实验结果
        3.5.1 上下文信息对实验结果的影响
        3.5.2 模板选取对实验结果的影响
        3.5.3 图像金字塔对实验结果的影响
        3.5.4 多模型融合
    3.6 本章小结
第四章 基于特征金字塔的多尺度行人检测算法
    4.1 基于端到端的多分辨率特征行人检测模型
        4.1.1 端到端行人检测网络设计
        4.1.2 实验结果及分析
    4.2 特征金字塔
        4.2.1 CNN特征可视化
        4.2.2 反卷积
        4.2.3 特征融合
        4.2.4 实验结果及分析
    4.3 难分样本挖掘和数据平衡
        4.3.1 难分样本挖掘算法
        4.3.2 数据平衡
        4.3.3 实验结果及分析
    4.4 基于软判决的非极大值抑制
        4.4.1 非极大值抑制
        4.4.2 基于软判决的非极大值抑制
    4.5 实验结果
    4.6 本章小结
第五章 总结与展望
    5.1 全文总结
    5.2 未来展望
参考文献
致谢
攻读学位期间发表的学术论文
攻读学位期间参与的项目



本文编号:3860383

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3860383.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d8979***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com