当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的视频总结算法研究与实现

发布时间:2023-10-27 17:55
  随着互联网的发展,视频数据也呈爆炸式增长,越来越多的视频被上传到网络上。因此,如何帮助用户快速、有效地,从海量的视频中挑选他们感兴趣的视频内容,便成为一个越来越重要的问题。其中,视频总结就是解决这类问题的一个有效方法。视频总结是视频内容的简要概括,它包含了视频中一些有趣的,能概括视频的一些视频帧或者视频片段。总的说来,视频总结可分为静态视频总结和动态视频总结。静态视频总结将视频浓缩为一些能描述视频内容的图片(剧情梗概图),而动态视频总结则是提取视频中具有代表性的,有趣的视频片段作为最终的总结结果。视频总结以静态或动态的方式,为用户提供视频内容的摘要,帮助用户在较短时间内充分了解视频内容,从而决定是否对完整的视频进行观看。本文对静态视频总结和动态视频总结进行了研究。针对静态视频总结,提出了一个新颖的基于密度的静态视频总结聚类算法。这个算法与已有的基于聚类的视频总结算法不同,它不需要预先人为设定簇类的个数,可以根据视频的内容适应性地产生一定数量的簇类中心,来得到有代表性的,能概括视频内容的剧情梗概图。本文提出的方法已经在静态视频总结领域的两个标准的数据库中验证,实验结果证明该方法的性能具有...

【文章页数】:56 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
    1.3 本文的主要研究内容
    1.4 本文的组织结构
第2章 基于聚类的静态视频总结
    2.1 相关研究工作
    2.2 基于聚类的静态视频总结方法
        2.2.1 预处理
        2.2.2 视觉特征的提取和单词表的构造
        2.2.3 词袋模型直方图的产生
        2.2.4 用基于密度的聚类方法进行帧的聚类
        2.2.5 静态视频总结结果的产生
    2.3 实验结果及分析
        2.3.1 数据库与评价标准
        2.3.2 实验部分
        2.3.3 关于DCVS方法的不足之处
    2.4 本章小结
第3章 基于眼动的双通道卷积神经网络
    3.1 相关研究工作
    3.2 基于眼动的双通道卷积神经网络
        3.2.1 视网膜中央凹图像的构造
        3.2.2 多帧运动矢量栈的构造
        3.2.3 基于眼动的双通道卷积神经网络在动态视频总结上的应用
    3.3 实验部分
        3.3.1 实验设置
        3.3.2 在SumMe数据库上的实验
        3.3.3 在TVSum数据库上的实验
    3.4 本章小结
第4章 总结与展望
    4.1 总结
    4.2 展望
参考文献
致谢
攻读硕士学位期间的研究成果



本文编号:3856994

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3856994.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5549d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com