基于视觉感知的HEVC编码技术研究

发布时间：2020-09-10 15:36

　　随着视频信息处理技术的快速发展,高清视频和超高清视频已逐渐走进我们的工作和生活。HEVC(High Efficiency Video Coding)作为新一代视频编码标准,在相同视频图像质量的条件下,可以比前一代的H.264降低50%左右的码流,特别适合高分辨率视频的压缩和传输。然而高分辨视频经过压缩后的码流数仍然很大,人们也越来越注重视频编码器在有限比特资源下的实际应用效果,并希望压缩后的视频图像质量更加符合人眼视觉特征。HEVC虽然提高了整体压缩效率,但它并没有根据人眼视觉特征进行编码。因此,本论文针对HEVC视觉感知编码技术展开研究具有重要的理论意义和良好的应用价值。本文根据人类视觉系统的特征,针对不同的视频场景研究基于视觉感知的HEVC编码方法,主要完成的工作和成果如下:(1)搭建基于HEVC验证模型X265的编码平台,分析HEVC的编码信息;根据人眼视觉特性设计视觉感知编码的总体方案,并选择视频图像质量的评价标准。(2)针对背景静止的视频场景,提出了一种基于HEVC压缩域的运动感知图提取方法。首先在当前帧HEVC编码之后,提取出运动矢量、划分结构以及编码模式等编码信息;然后快速判别当前帧是否存在全局运动,并对当前帧的运动矢量求取幅值得到运动矢量幅值图;接着在空间域和时间域上分别对运动矢量幅值进行处理,从而快速有效的检测出当前帧的运动区域;最后根据运动强度和纹理强度将提取的运动区域生成运动感知图,为后续运动区域的视觉感知编码提供参考。(3)针对全局运动的视频场景,设计了一种基于边缘检测的纹理感知图提取方法。首先采用Canny算子对当前帧进行边缘检测得到当前帧二值化后的边缘图;接着对边缘图中当前CU所在的区域进行边缘点数统计;然后利用图像中相邻区域的相似性对结构化纹理区域进行处理;最终生成包含当前帧平坦区域、结构化纹理区域和复杂纹理区域的纹理感知图,为后续纹理区域的视觉感知编码提供参考。(4)针对视觉感知编码中比特资源分配的问题,提出了一种编码块量化参数调整和变换域频率系数压制的方法。对于背景静止场景,利用运动感知图进行量化参数的调整和频率系数压制,提升运动区域图像质量;对于全局运动场景,利用纹理感知图进行频率系数压制,并根据运动矢量的方向对边缘块进行处理,保证视频图像质量的同时,降低峰值码率和整体码流比特数。
【学位单位】：浙江工业大学
【学位级别】：硕士
【学位年份】：2018
【中图分类】：TN919.81
【部分图文】：

框架图,编码结构,框架,编码技术

它区域则为非感兴趣区域。因此，利用 HVS 的这些特性，可用来指导现有的视频编码过程。目前针对 H.264 的感兴趣区域编码研究已经取得了一定的成果，而HEVC 中没有引入关于视觉感知的编码技术，针对 HEVC 的视觉感知编码研究还处于起步阶段[17]。因此，本论文对基于视觉感知的 HEVC 编码技术展开研究具有重要的理论意义和良好的应用价值。1.2 国内外研究现状1.2.1 HEVC 编码技术HEVC 采用的是混合编码框架，其框架结构如图 1-1 所示。HEVC 引入了更加灵活的块划分、帧间预测非对称运动划分和多方向的帧内预测模式等众多的编码工具，进一步提高了压缩性能[18]。

层次结构图,层次结构,划分标志,编码单元

分技术同区域上实现更为灵活的编码，HEVC 提供编码单元（Coding Unit, CU）、预测单元（Pnsform Unit, TU）[19,20]。这种划分方式能够针划分方式。在 HEVC 中，一帧视频图像被 64×64、32×32、16×16 或 8×8，具体可由用户个亮度编码块（Coding Block, CB）和两个法。一个 CTU 可以不划分，是一个 64×64U 是否继续划分由划分标志位（记为 Flag）度为 d 的 CU，如果 Flag 为 1，则 CU 可以划 CU 不划分。如图 1-2 给出了 CU 的划分层次到最大，不能继续划分。

预测模式,帧内

浙江工业大学硕士学位论文U 是帧内和帧间预测的基本单元，贯穿着整个预测环节，比如，帧运动矢量预测和预测参考图像索引号。相对于 H.264，HEVC 采用划分模式，其中帧内模式包括：2N×2N 和 N×N，帧间 PU 模式包括e、2N×2N、N×N、N×2N、2N×N、2N×nU、2N×nD、nL×2N 和 nR×1-3 为 PU 预测模式的划分形式，表 1-1 为 HEVC 与 H.264 在 PU 划比。

【参考文献】