基于深度学习的帧内预测编码技术研究
发布时间:2023-09-17 06:16
最新一代视频压缩标准是高性能视频编码(High Efficiency Video Coding,HEVC)。相比于H.264,HEVC能够在相同主观质量下实现近一半的码率节省。然而,HEVC中包含的主要模块仍是经过手工设计和优化得到。手工设计通常依赖于信号平稳的假设,而自然视频特性十分复杂,因此HEVC中模块的最优性很难保证。深度学习可以从训练数据中自动学习出特征提取器,适合于解决有监督学习问题。目前深度学习在很多计算机视觉任务中取得了巨大的成功。受此启发,本文使用深度学习来解决视频帧内预测中的部分问题。本文的第一个贡献点是提出了基于深度学习的块上采样编码技术。变采样编码,即编码之前下采样编码之后上采样,是压缩高清视频的一种常见策略。传统的变采样编码方案大多采用手工设计的上采样滤波器,极大地限制了性能。因此本文的第一个工作包含以下创新点以提升编码性能:本文设计了用于亮度和色度分量上采样的卷积神经网络;本文提出了将上采样卷积神经网络高效集成到帧内编码框架的方案;本文提出了一个两阶段上采样过程,其中第一阶段在逐块编码循环内,第二阶段在循环之外以改善编码单元边界处的重建;本文推导了下采样块的...
【文章页数】:103 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景及意义
1.2 研究历史和现状
1.2.1 变采样编码以及下、上采样技术的发展
1.2.2 色度帧内预测以及图像着色
1.3 研究内容和创新点
1.3.1 基于深度学习的块上采样编码技术
1.3.2 基于深度学习的块下采样编码技术
1.3.3 基于深度学习的交叉通道预测技术
1.4 论文内容安排
第2章 基础知识
2.1 HEVC简介
2.1.1 HEVC基本框架
2.1.2 图片表达
2.1.3 块划分
2.1.4 预测
2.1.5 变换和量化
2.1.6 熵编码
2.1.7 环路滤波
2.2 深度学习简介
2.2.1 前馈神经网络
2.2.2 卷积神经网络
第3章 基于深度学习的块上采样编码技术
3.1 提出方法的框架
3.2 提出的基于CNN的上采样
3.2.1 基于CNN的亮度上采样
3.2.2 基于CNN的色度上采样
3.3 提出的编码参数设定
3.4 提出的两阶段上采样
3.5 实验结果
3.5.1 实验设置
3.5.2 结果和分析
3.6 本章小结
第4章 基于深度学习的块下采样编码技术
4.1 提出的图像CR框架以及CNN-CR
4.1.1 基于学习的图像CR
4.1.2 提出的CNN-CR
4.2 提出的CNN-CR的训练
4.2.1 单独训练CNN-CR
4.2.2 联合训练CNN-CR和CNN-SR
4.3 提出的将CNN-CR用于图像压缩的方案
4.3.1 帧级下、上采样方案
4.3.2 块级自适应下、上采样方法
4.4 实验结果
4.4.1 单独训练的CNN-CR
4.4.2 联合训练的CNN-CR
4.4.3 CNN-CR用于图像编码的结果
4.5 本章小结
第5章 基于深度学习的交叉通道预测技术
5.1 提出的方法
5.1.1 交叉通道预测的网络框架
5.1.2 损失函数
5.1.3 网络超参数
5.1.4 嵌入HEVC
5.2 实验结果
5.2.1 实验设置
5.2.2 结果和分析
5.3 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
本文编号:3847171
【文章页数】:103 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景及意义
1.2 研究历史和现状
1.2.1 变采样编码以及下、上采样技术的发展
1.2.2 色度帧内预测以及图像着色
1.3 研究内容和创新点
1.3.1 基于深度学习的块上采样编码技术
1.3.2 基于深度学习的块下采样编码技术
1.3.3 基于深度学习的交叉通道预测技术
1.4 论文内容安排
第2章 基础知识
2.1 HEVC简介
2.1.1 HEVC基本框架
2.1.2 图片表达
2.1.3 块划分
2.1.4 预测
2.1.5 变换和量化
2.1.6 熵编码
2.1.7 环路滤波
2.2 深度学习简介
2.2.1 前馈神经网络
2.2.2 卷积神经网络
第3章 基于深度学习的块上采样编码技术
3.1 提出方法的框架
3.2 提出的基于CNN的上采样
3.2.1 基于CNN的亮度上采样
3.2.2 基于CNN的色度上采样
3.3 提出的编码参数设定
3.4 提出的两阶段上采样
3.5 实验结果
3.5.1 实验设置
3.5.2 结果和分析
3.6 本章小结
第4章 基于深度学习的块下采样编码技术
4.1 提出的图像CR框架以及CNN-CR
4.1.1 基于学习的图像CR
4.1.2 提出的CNN-CR
4.2 提出的CNN-CR的训练
4.2.1 单独训练CNN-CR
4.2.2 联合训练CNN-CR和CNN-SR
4.3 提出的将CNN-CR用于图像压缩的方案
4.3.1 帧级下、上采样方案
4.3.2 块级自适应下、上采样方法
4.4 实验结果
4.4.1 单独训练的CNN-CR
4.4.2 联合训练的CNN-CR
4.4.3 CNN-CR用于图像编码的结果
4.5 本章小结
第5章 基于深度学习的交叉通道预测技术
5.1 提出的方法
5.1.1 交叉通道预测的网络框架
5.1.2 损失函数
5.1.3 网络超参数
5.1.4 嵌入HEVC
5.2 实验结果
5.2.1 实验设置
5.2.2 结果和分析
5.3 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
本文编号:3847171
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3847171.html