当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的端到端图像视频压缩框架

发布时间:2024-11-10 19:52
  图像和视频压缩一直是学术界和工业界研究的热点之一。近年来,随着深度学习技术的发展,尤其是卷积神经网络在图像处理和计算机视觉领域的成功应用,利用深度学习技术来对图像和视频高效压缩成为可能。目前深度学习技术在高层视觉领域,如图像分类,目标检测,目标跟踪,图像分割,人脸识别等,已经取得了突破性的研究成果,然而在低层视觉上,如图像压缩,图像复原等领域的应用还具有很大的研究潜力和价值。本文以深度学习技术为基础,主要研究工作分为以下两个部分:一、提出了基于深度学习的端到端图像压缩框架,将深度学习技术与传统的图像编解码器(如JPEG,JPEG2000和BPG等)无缝的衔接起来,进一步提高编解码器的压缩性能。二、着眼于视频帧率转换中的插帧技术,提出了基于运动补偿模型的深度学习插帧网络模型。为了能提高压缩图像质量的同时提高压缩比,我们将两个卷积神经网络和传统编解码器整合到一个端到端的图像压缩框架中。第一个卷积神经网络Com CNN在编码器前端,用来学习原图像的紧凑表示,学习到的紧凑表示被送到传统编码器进行编码。第二个卷积神经网络Rec CNN在解码器后端,通过解码后的紧凑表示来高质量的重建原图像。为了让这...

【文章页数】:62 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题研究背景及意义
        1.1.1 图像和视频中的冗余
        1.1.2 深度学习在图像和视频编码中应用的关键问题
    1.2 国内外研究现状
        1.2.1 图像压缩的研究现状
        1.2.2 视频帧率转换的研究现状
    1.3 论文内容及结构安排
第2章 深度学习基础及其在低层视觉领域的应用
    2.1 深度学习基础
        2.1.1 卷积神经网络
    2.2 深度学习在图像压缩复原上的应用
    2.3 深度学习在视频帧率转换上的应用
    2.4 本章小结
第3章 基于卷积神经网络的端到端图像压缩框架
    3.1 问题的提出以及提出的图像压缩框架
        3.1.1 ComCNN网络结构
        3.1.2 RecCNN网络结构
    3.2 学习算法
        3.2.1更新RecCNN的参数θ2
        3.2.2更新ComCNN的参数θ1
    3.3 损失函数
    3.4 实验数据和实验结果
        3.4.1 实验数据和参数设置
        3.4.2 实验结果
    3.5 本章小结
第4章 基于深度学习的视频帧率转换技术
    4.1 问题的提出以及本文提出的方法
    4.2 前后帧融合的深度学习插帧算法
    4.3 基于运动补偿的深度学习插帧算法
        4.3.1 多尺度运动补偿网络(MC-subnet)
        4.3.2 质量增强网络(QE-subnet)
    4.4 损失函数
    4.5 实验配置及实验结果
        4.5.1 实验配置及数据集
        4.5.2 实验结果
    4.6 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其他成果
致谢



本文编号:4011872

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4011872.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ba0cd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com