面向深度图像的3D-HEVC帧内编码模式决策快速算法研究
发布时间:2020-05-31 20:45
【摘要】:近年来随着影视工业、新兴智能视觉交互技术的快速发展,三维视频处理研究迅速成为热点。国际视频编码标准的两大制定组织ITU-T和ISO/IET联合制定了新一代的高效率三维视频编码标准(3D-HEVC)。为了显著减少视点个数,3D-HEVC增加了包含视频场景几何信息的深度图像,显著提高了三维视频压缩效率和合成视点的图像质量,但深度图像编码的计算复杂度非常高,其编码时间是彩色图像的六倍左右。因此,为了降低3D-HEVC中深度图像编码的复杂度,本论文对其计算最为集中的模式决策部分进行研究,包括编码单元(CU)划分、帧内预测模式决策以及深度预测模式(DMM)决策过程。主要完成的工作和成果如下:(1)针对CU划分过程,提出了一种基于纹理特征分析的深度图像CU划分快速算法。首先利用深度图像纹理变化特征与CU划分特征之间的对应关系进行初级纹理特征分析;然后根据CU内部像素分布统计特性进行精细纹理特征分析;接着利用上述特征对CTU进行划分深度预测,并适当终止部分CU的划分。此外,本论文根据测试序列纹理特征和量化参数(QP)调整该快速算法中的灰度分级数和CU纹理复杂度阈值,使算法具有更好的序列适应性。(2)针对帧内预测模式决策过程,提出了一种基于机器学习分类的帧内预测模式决策快速算法。首先通过对37种帧内预测模式设置类别标签,提取相关特征进行离线训练得到随机森林预测模型;然后用模型预测当前预测单元(PU)最佳类别标签,建立与类别标签对应的候选预测模式列表,以减少模式决策过程中进行哈达码优化的预测模式个数;最后利用候选模式列表内预测模式之间哈达玛代价的幅值关系来减少进行率失真代价计算的候选预测模式个数。(3)针对深度图像深度预测模式引入的计算复杂度,提出了一种基于像素特征分析的DMM预测模式决策算法,首先分析当前PU内部像素的分布特征以及当前PU尺寸与DMM模式选择的相关性;然后通过计算当前PU上下左右四个边界DMM特征标识来判断当前PU是否采用DMM预测模式,以减少部分PU的DMM模式计算,进一步优化PU的模式判决。
【图文】:
DC 模式[27],每个模式代表了图像纹理的预测在HEVC参考模型中,帧内预测先进行粗级模式[28],通过计算 35 种 PU 的残差信号哈达玛代价的绝对误差和(Sum of Absolute Transformed 测模式,对于尺寸为 4×4 和 8×8 的 PU,候选预6、32×32 和 64×64 的 PU,候选预测模式个数性,将空间相邻的预测模式添加到预测模式集Distortion Optimization, RDO)[30],选取最佳帧与运动矢量(Motion Vector, MV)相关的 Mernced Motion Vector Prediction, AMVP)[33]编码模列表选择最佳MV并通过运动搜索对得到的M含 5 个 MV 的候选列表,列表中率失真代价最Merge 模式只需要传输最佳预测 MV 的索引特数。
根据方向将扫描方式分为水平、对角和垂直。对于尺寸为 8×8 和 4×4 的 TU 根据帧内预测模式选择扫描方式,其他尺寸 TU 采用对角扫描方式。此外,HEVC 只采用了 CABAC 编码[37],CABAC 包括二进制化、上下文建模和二进制算术编码[38]这三个过程。1.2.2 3D-HEVC 标准编码框架3D-HEVC 继承了 HEVC 的混合编码框架,为了平衡视频数据量与视点个数之间的矛盾,3D-HEVC 还引入了深度视频的编码,大幅度降低了视频数据量的同时又最大限度的利用了视点间的相关性来增加 3D 视频的视点数目,为用户提供了更为自由的交互体验。图 1-4 为 3D-HEVC 视频系统结构,,包含编码部分和在解码显示部分。在编码端利用 3D-HEVC 编码器对各个视点的彩色视频和深度视频进行压缩编码得到对应的子比特流,子比特流融合为一个比特流可用于网络传输和存储。在解码端可根据实际显示设备的播放条件,选择适合的子比特流,若为多视点视频显示设备则提取所有彩色和深度视频子比特流用于解码播放,若为传统 3D 视频则提取彩色视频两个子比特流,若为传统 2D 播放设备则仅提取彩色视频一个子比特流。
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TN919.81
【图文】:
DC 模式[27],每个模式代表了图像纹理的预测在HEVC参考模型中,帧内预测先进行粗级模式[28],通过计算 35 种 PU 的残差信号哈达玛代价的绝对误差和(Sum of Absolute Transformed 测模式,对于尺寸为 4×4 和 8×8 的 PU,候选预6、32×32 和 64×64 的 PU,候选预测模式个数性,将空间相邻的预测模式添加到预测模式集Distortion Optimization, RDO)[30],选取最佳帧与运动矢量(Motion Vector, MV)相关的 Mernced Motion Vector Prediction, AMVP)[33]编码模列表选择最佳MV并通过运动搜索对得到的M含 5 个 MV 的候选列表,列表中率失真代价最Merge 模式只需要传输最佳预测 MV 的索引特数。
根据方向将扫描方式分为水平、对角和垂直。对于尺寸为 8×8 和 4×4 的 TU 根据帧内预测模式选择扫描方式,其他尺寸 TU 采用对角扫描方式。此外,HEVC 只采用了 CABAC 编码[37],CABAC 包括二进制化、上下文建模和二进制算术编码[38]这三个过程。1.2.2 3D-HEVC 标准编码框架3D-HEVC 继承了 HEVC 的混合编码框架,为了平衡视频数据量与视点个数之间的矛盾,3D-HEVC 还引入了深度视频的编码,大幅度降低了视频数据量的同时又最大限度的利用了视点间的相关性来增加 3D 视频的视点数目,为用户提供了更为自由的交互体验。图 1-4 为 3D-HEVC 视频系统结构,,包含编码部分和在解码显示部分。在编码端利用 3D-HEVC 编码器对各个视点的彩色视频和深度视频进行压缩编码得到对应的子比特流,子比特流融合为一个比特流可用于网络传输和存储。在解码端可根据实际显示设备的播放条件,选择适合的子比特流,若为多视点视频显示设备则提取所有彩色和深度视频子比特流用于解码播放,若为传统 3D 视频则提取彩色视频两个子比特流,若为传统 2D 播放设备则仅提取彩色视频一个子比特流。
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TN919.81
【相似文献】
相关期刊论文 前10条
1 周自顾;曹杰;郝群;高泽东;肖宇晴;;保留边界特征的深度图像增强算法研究[J];应用光学;2018年02期
2 刘田间;郭连朋;朱y
本文编号:2690433
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2690433.html