当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的多粒度分析视频分割技术

发布时间:2021-04-29 19:39
  视频分割的目的是从充满噪声背景中分离出感兴趣的目标物体,并已经在计算机视觉领域得到广泛的应用,如三维重建,视频摘要等。近十年来,人们提出了许多和概率图模型相关的算法,例如马尔科夫随机场(MRF)和条件随机场(CRF),用来估计每个像素或超像素的目标动作。尽管这些算法在多个数据集中表现良好,但视频分割仍面临两个主要挑战。首先,当利用图模型计算像素或超像素级别的时间一致性时,连续帧之间经常存在错误配对。例如,超像素算法使用每个帧的超像素对时间一致性进行建模,而超像素不匹配造成的不准确性不可避免地被逐帧迭代,最终导致视频分割算法的失败。我们还注意到,跨越几个帧开发超像素模型在计算上效率非常低下。其次,由于视觉追踪算法输出为矩形的跟踪框,估计的目标对象的运动通常包含嘈杂的背景,而这些跟踪框常常不能完全紧密的包围物体。视频跟踪的最新进展对视觉分割几乎没有什么帮助。为了解决这些挑战,我们提出了一种将多示例学习(MIL)算法应用于视频分割的空间和时间域的新颖框架。与大多数机器学习算法相比,该算法为每个训练实例分配一个标签,采用MIL为标签分配实例。在二分类情况下,如果包中至少有一个实例为正,那么一个... 

【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:87 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及意义
        1.1.1 视频分割技术
        1.1.2 深度学习
    1.2 研究基础及现状
    1.3 主要内容和章节安排
第二章 视频分割算法相关背景知识
    2.1 视频分割领域数据库
        2.1.1 评价标准
        2.1.2 常用数据库
    2.2 基本概念
        2.2.1 超像素
        2.2.2 深度卷积神经网络
        2.2.3 多示例学习(MIL)
    2.3 传统视频分割算法
        2.3.1 图模型算法
        2.3.2 端到端的深度学习网络
第三章 基于深度学习的时间-空间多示例学习算法
    3.1 层级CNN超像素特征算法
        3.1.1 超像素CNN特征表达
        3.1.2 层级CNN超像素特征
    3.2 基于时间-空间多示例学习的视频分割算法
        3.2.1 建模过程
        3.2.2 Boosting-MIL算法 .
        3.2.3 图像上的多示例学习算法
        3.2.4 时间空间上的多示例学习算法
第四章 基于多粒度分析的视频分割算法
    4.1 基于卷积神经网络的跟踪框生成
        4.1.1 卷积特征
        4.1.2 自相关滤波器的构造
        4.1.3 从粗到细粒度迁移估计
        4.1.4 区域选取技术
    4.2 基于图割的分割边缘优化
        4.2.1 一元项
        4.2.2 二元项
    4.3 多粒度分析算法流程
第五章 实验结果与分析
    5.1 实验实施细节
        5.1.1 参数设置
        5.1.2 实验技巧
    5.2 实验结果
    5.3 结果分析
全文总结
参考文献
致谢
攻读学位期间发表的学术论文
攻读学位期间参与的项目



本文编号:3168054

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3168054.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户469c6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com