视频编码中帧间预测技术研究

发布时间:2021-05-09 08:45
  在信息化高度发展的当今社会,视频数据成为了主要的多媒体数据形式。人们对宽色域、高清晰度、高分辨率的视频需求日益高涨,这对视频数据的存储、传输造成极大的负担。应用现状对视频压缩提出了更高的要求,探索更高编码效率的压缩技术成为国内外研究的重点问题。本文致力于提高视频编解码中帧间预测技术的编码效率,并主要从提高运动矢量的预测准确度和提高预测块的预测准确度两个方面着手,主要工作和贡献包括以下几个方面:1.提出基于虚拟运动矢量的运动矢量预测机制,解决长期参考机制下运动矢量预测值候选项不足的问题。长时运动矢量和短时运动矢量相关性弱,在现有的视频编码技术中,两者不能交叉预测,这将导致运动矢量预测值候选项不足。为此,我们利用重建像素在参考帧上进行运动搜索导出缺失类型的运动矢量,导出的运动矢量为虚拟运动矢量。这样保证每个编码块重建完成后同时具有长时运动矢量和短时运动矢量。后续块进行运动矢量预测编码时,可从任一相邻块选择同类型的MV进行预测。同时,由于真实运动矢量置信度高于虚拟运动矢量,我们提出了基于置信度的运动矢量预测值构造机制,使得编码性能提升1%。2.提出了基于空间相邻像素的自适应双向加权预测技术,... 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:116 页

【学位级别】:博士

【文章目录】:
致谢
摘要
Abstract
1 绪论
    1.1 视频编码综述
        1.1.1 视频编码的基础
        1.1.2 混合视频编码框架
    1.2 帧间预测技术简介
        1.2.1 HEVC中帧间预测技术
        1.2.2 VVC中帧间预测技术
    1.3 基于深度学习的视频编码技术简介
        1.3.1 基于神经网络的新编码框架
        1.3.2 基于神经网络的预测技术
        1.3.3 基于神经网络的量化及熵编码技术
        1.3.4 基于神经网络的环路滤波技术
    1.4 本文研究问题与内容组织
2 长期参考机制下运动矢量预测的研究
    2.1 基于知识库的长期参考技术概述
        2.1.1 知识库构建
        2.1.2 长期参考下运动矢量预测技术
    2.2 基于虚拟运动矢量的运动信息预测
        2.2.1 虚拟运动矢量构造
        2.2.2 运动矢量预测列表构建
    2.3 实验结果及讨论
        2.3.1 基于知识库的长期参考技术
        2.3.2 基于虚拟运动矢量的运动矢量预测
    2.4 本章小结
3 自适应双向线性加权预测的研究
    3.1 双向加权预测概述
    3.2 自适应双向加权预测的分析
        3.2.1 最佳权重分布
        3.2.2 均匀加权预测准确度分析
    3.3 基于模板相似度的双向加权预测
        3.3.1 模板相似度度量
        3.3.2 基于相似度的权重因子导出
    3.4 与先进帧间预测技术耦合
        3.4.1 与LIC技术耦合
        3.4.2 与DMVR技术耦合
        3.4.3 与BDOF技术耦合
    3.5 实验分析
        3.5.1 模板相似度SAD和SATD对编码性能的影响
        3.5.2 亚像素插值对编码性能的影响
        3.5.3 空间相邻像素步长对编码性能的影响
        3.5.4 自适应双向加权预测的编码性能
    3.6 本章小结
4 利用空间信息的基于卷积神经网络的双向预测
    4.1 研究背景
        4.1.1 帧内帧间联合预测
        4.1.2 基于神经网络的帧间预测技术
    4.2 利用空间相邻像素的双向预测
        4.2.1 网络结构
        4.2.2 HEVC中SICNN的使用
    4.3 实验分析
        4.3.1 空间相邻像素步长的影响
        4.3.2 不同块大小下编码性能
        4.3.3 两种帧间模式的有效性分析
        4.3.4 与现有工作进行对比
        4.3.5 分析与讨论
    4.4 本章小结
5 利用时空信息的基于卷积神经网络的双假设预测
    5.1 问题分析
    5.2 利用空间相邻像素及时域距离的双假设预测
        5.2.1 输入信息重要性
        5.2.2 网络结构
        5.2.3 集成到编解码过程
    5.3 实验分析
        5.3.1 不同帧间模式下STCNN的使用
        5.3.2 时空信息有效性分析
        5.3.3 与现有技术对比
        5.3.4 与先进帧间预测技术耦合
        5.3.5 编解码性能
    5.4 本章小结
6 总结与展望
    6.1 对本文的总结
    6.2 对本文的展望
参考文献
攻读博士学位期间主要的学术成果



本文编号:3176996

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3176996.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户69c0e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com