视频/图片集摘要提取的结构化稀疏编码方法

发布时间:2020-12-29 16:31
  提取对于视频和图片集的浏览和组织以及在机器人领域具有非常重要的作用。当前的摘要提取主要分为两大类:基于关键帧提取的摘要技术和基于主题目标发现的摘要技术。在过去的20年中,基于关键帧提取的摘要技术虽然已经有非常多的研究工作,但是许多之前的方法都是针对结构化视频。非结构化视频的关键帧提取依然是一个非常有挑战性的问题。除此之外,基于主题目标发现的摘要技术当前只能得到一个非常粗略的发现结果。本文在稀疏编码和字典学习的框架下,围绕视频和图片集的摘要问题,研究了样例提取,关键帧选择和主题目标发现等问题,论文主要贡献包括:(1)针对鲁棒样例提取的基础性工作,提出一个能够同时刻画重构能力,样本多样性和鲁棒性结构化稀疏编码模型。模型中引入了1,2L重构误差来分离野点,提高鲁棒性,引入互抑制项来防止相似的样本被同时选中。我们利用ADMM(Alternating Directional Method of Multiplier)优化算法来解决这个优化问题,并在不同的数据集上了验证了该模型的有效性。(2)针对基于关键帧的非结构化视频的摘要提取,我们在鲁棒样例提取的基础上,通过引入一个直接的时间依赖惩罚项来防止... 

【文章来源】:清华大学北京市 211工程院校 985工程院校 教育部直属院校

【文章页数】:68 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 引言
    1.1 研究背景
    1.2 基于关键帧的摘要技术
    1.3 基于主题目标提取的摘要技术
    1.4 本文的主要贡献与结构
        1.4.1 本文的主要贡献
        1.4.2 论文结构
第2章 鲁棒样例提取
    2.1 引言
    2.2 问题描述
    2.3 优化算法
    2.4 实验结果
        2.4.1 数值算例
        2.4.2 YaleB人脸数据集
        2.4.3 ISOLET数据集
    2.5 本章小结
第3章 非结构化视频的摘要提取
    3.1 引言
    3.2 问题描述
    3.3 优化算法
    3.4 实验结果
        3.4.1 消费类视频摘要
        3.4.2 机器人实验
    3.5 本章小结
第4章 图片集的主题目标发现
    4.1 引言
    4.2 问题描述
    4.3 优化算法
        4.3.1 稀疏编码
        4.3.2 字典学习
        4.3.3 讨论
    4.4 主题目标发现
    4.5 实验结果
        4.5.1 数据集
        4.5.2 方法比较
        4.5.3 评价方法
        4.5.4 结果
        4.5.5 样例分析
    4.6 结论
第5章 结论与展望
    5.1 研究总结
    5.2 未来工作展望
参考文献
致谢
个人简历、在学期间发表的学术论文与研究成果



本文编号:2945939

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2945939.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4accb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com