360度视频编码中块划分技术研究
发布时间:2020-08-27 12:47
【摘要】:近年来,随着计算机处理能力的提升及传感显示元件成本的降低,虚拟现实技术日益成熟,已成为如今计算机科学和工业应用等领域的热点话题。随着虚拟现实在商业上的广泛应用,360度视频作为一种提供沉浸式体验的新型媒体已经引起越来越多的关注,逐渐成为热门研究方向。正在探索下一代视频编码标准的联合探索小组JVET将360视频与SDR和HDR视频一起纳入标准范围内。和传统的视频相比,360度视频的分辨率更高,数据量更大,给实际应用带来了巨大的挑战,编码效率问题亟待解决。本文针对360度视频编码中的块划分技术提出了两种优化算法。第一种是基于编码树单元纬度的360度视频快速编码算法。该算法根据ERP格式越靠近两极采样率越高的特性,将ERP格式分成3个区域,并根据采样率高低确定每个区域的深度区间。算法执行时,首先根据编码树单元内每个像素的纬度计算出当前编码树单元的纬度,然后根据编码树单元纬度将编码树单元映射到其中一个区域,所属区域的深度区间即为当前编码树单元的深度区间。本算法在RA10配置、端到端WS-PSNR评价标准下,与国际标准参考软件HM16.15-360Lib3.0相比,在造成亮度分量编码性能损失0.6%时能够获得11.9%的编码时间节省。第二种是基于相邻CTU深度和当前CTU梯度的快速深度决策算法。该算法包括两个部分,第一部分根据相邻CTU深度对当前CTU进行深度范围的预测,这部分算法利用了相邻编码树单元的最大和最小深度信息,同时考虑到360度视频的高分辨率特性,进一步缩小了划分深度范围。第二部分根据当前编码树单元的梯度对第一部分得到的划分深度范围进行调整,主要针对第一部分中划分深度范围过窄及纹理足够简单的编码树单元。两部分相互结合得到最终深度范围值。在RA10配置、端到端WS-PSNR评价标准下,该算法能够在亮度分量只有0.3%的编码性能损失时,带来29.1%的编码时间节省。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN919.81
【图文】:
哈尔滨工业大学工学硕士学位论文第 2 章 360 度视频的基本框架及相关技术联合视频探索小组 JVET 已经开发出一个 360Lib 软件包,该软件包既可以作为独立的转换工具,方便各种投影格式之间进行格式转换,也可以与 HM或 JEM 结合使用,一起进行编码之前或者之后的投影格式转换、压缩及质量评价计算,而无需存储在中间步骤产生的 YUV 序列。在 360Lib 支持的投影格式中,还包括使用直线投影的视口生成。360Lib 软件包包含 360 度视频常见测试条件的示例配置文件以及软件的使用手册。2016 年 10 月的第五届 JVET 会议上,360Lib 参考软件同意成立。第一版的 360Lib v1.0 于 2016 年 12 月正式发布,第二版 360Lib v2.0 于 2017年 2 月发布。
图 2-3 360Lib 中的(u, v)平面中的采样坐标定义来介绍几种主要的投影格式。等矩形投影格式(ERP)矩形影格式是 360 度视频使用最为广泛的投影格式。该格式只影时,将整个球面视频映射到一个 2D 矩形面上。如下图 2-4θ =-90θ =0 =-180 =0 =180vmn
图 2-7 八面体投影格式 的面拼接如下图 2-8(a)所示,其中的边缘,这种不连续边缘可能难以编码滑这些不连续边缘[35]。如图 2-8(b)所充样本的带,这 16 个填充样本(p)是性混合并垂直内插得到。COHP 中八个三角面拼接成一张矩形图像
本文编号:2806121
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN919.81
【图文】:
哈尔滨工业大学工学硕士学位论文第 2 章 360 度视频的基本框架及相关技术联合视频探索小组 JVET 已经开发出一个 360Lib 软件包,该软件包既可以作为独立的转换工具,方便各种投影格式之间进行格式转换,也可以与 HM或 JEM 结合使用,一起进行编码之前或者之后的投影格式转换、压缩及质量评价计算,而无需存储在中间步骤产生的 YUV 序列。在 360Lib 支持的投影格式中,还包括使用直线投影的视口生成。360Lib 软件包包含 360 度视频常见测试条件的示例配置文件以及软件的使用手册。2016 年 10 月的第五届 JVET 会议上,360Lib 参考软件同意成立。第一版的 360Lib v1.0 于 2016 年 12 月正式发布,第二版 360Lib v2.0 于 2017年 2 月发布。
图 2-3 360Lib 中的(u, v)平面中的采样坐标定义来介绍几种主要的投影格式。等矩形投影格式(ERP)矩形影格式是 360 度视频使用最为广泛的投影格式。该格式只影时,将整个球面视频映射到一个 2D 矩形面上。如下图 2-4θ =-90θ =0 =-180 =0 =180vmn
图 2-7 八面体投影格式 的面拼接如下图 2-8(a)所示,其中的边缘,这种不连续边缘可能难以编码滑这些不连续边缘[35]。如图 2-8(b)所充样本的带,这 16 个填充样本(p)是性混合并垂直内插得到。COHP 中八个三角面拼接成一张矩形图像
【参考文献】
相关期刊论文 前1条
1 周忠;周颐;肖江剑;;虚拟现实增强技术综述[J];中国科学:信息科学;2015年02期
相关硕士学位论文 前1条
1 王洋;HEVC帧内编码优化算法研究[D];哈尔滨工业大学;2014年
本文编号:2806121
本文链接:https://www.wllwen.com/kejilunwen/wltx/2806121.html