基于GPU的AVS2高速并行运动估计算法研究
发布时间:2020-05-04 23:12
【摘要】:AVS2是继AVS1之后推出的具有我国自主知识产权的新一代视频编码标准,通过四叉树编码单元灵活划分方式、新的编码技术等在保证图像质量的情况下编码效率相比H.264/AVC提高了一倍,编码能力与HEVC相当,但是在场景编码方式上,编码效率达到了H.264/AVC的4倍,付出的代价是编码复杂度的大幅度提升,使得在目前的硬件平台很难实现高清超高清视频的实时编码。另一方面随着信息技术的不断发展GPU在海量数据并行处理和内存带宽上的优势越来越明显,NVIDIA推出的CUDA编程模型使得GPU的通用开发应用更加简单灵活。本文在详细研究了AVS2和CUDA编程模型和原理的基础上主要针对AVS2编码中耗时较长的帧间运动估计部分进行优化包括:帧间运动估计预搜索、整像素搜索、子像素运动搜索,具体研究工作主要体现在以下几个方面:1)在帧间运动估计的预搜索过程中,利用快速搜索算法对当前最大编码单元块进行运动估计,每个线程计算一个4x4块大小的绝对误差和(SAD),并进行线程块归约合并求得预搜索运动向量。2)在整像素运动搜素中,采用映射表算法代替编码单元块的大型数据结构,并采用类积分图算法原理,对每个4x4块大小的绝对误差和(SAD)进行的预测单元块的合并,并充分使用共享内存和纹理内存存储当前帧和参考帧数据、合理利用共享内存、局部变量、指令优化、CUDA函数调用等优化方法提高数据读写速度,减少线程同步次数,提高线程利用率,增加内核函数并发次数,减少分支语句等,从而优化了并行速度。3)在子像素搜索过程中充分利用编码单元的层次划分进行并行化设计,对每层编码单元进行预测模式循环,并继承整像素搜索过程的优化方案进行算法优化。实验仿真表明,进行优化后的AVS2视频编码在相比较在CPU端的运行速度加速性能上有明显提升,本文优化方案有一定的研究意义和实用价值。
【图文】:
天津大学硕士学位论文对于超高分辨率的视频和图像,当前的新标准在编码效率上依然有待提高。并且,由于新标准编码复杂度的提高,对硬件也提出了更高的要求。而在视频编码各模块中,帧间运动估计部分是较为耗时的部分。因此,,对帧间运动估计部分的加速是十分重要的一环。1.1.2 视频编码技术的编码框架新一代视频编码技术沿用了 H.264/AVC 的混合编码框架[1],如图 1-1 所示。预测部分主要包括帧内预测和帧间预测两个部分。帧内预测通过利用一帧图像内部的空间上像素的相关性,进而达到去除冗余信息的目的。帧间预测利用运动图像相邻帧之间时间上的相关性,去除视频序列时间上的冗余信息。变换量化是将预测残差进行处理去除空间信号的相关性,从而将视频数据进一步压缩。熵编码主要是去除信源中的信息熵冗余,将变换量化后的视频序列的信息转化为易于存储和传输的压缩码流。
天津大学硕士学位论文3)变换单元(Transform Units,TU)是进行变换和量化的基本单元,是在 CU的基础上划分的,但受到所在的预测单元 PU 块大小的限制。在帧内编码模式中TU 块尺寸小于等于 PU 尺寸,在帧间编码模式中可以大于预测单元,当 PU 块是规则划分时,TU 必须为正方形,当 PU 块采用非规则 AMP 划分模式时 TU 为条带状,四叉树单元块划分具体表现形式为图 2-2 所示。
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN919.81
本文编号:2649134
【图文】:
天津大学硕士学位论文对于超高分辨率的视频和图像,当前的新标准在编码效率上依然有待提高。并且,由于新标准编码复杂度的提高,对硬件也提出了更高的要求。而在视频编码各模块中,帧间运动估计部分是较为耗时的部分。因此,,对帧间运动估计部分的加速是十分重要的一环。1.1.2 视频编码技术的编码框架新一代视频编码技术沿用了 H.264/AVC 的混合编码框架[1],如图 1-1 所示。预测部分主要包括帧内预测和帧间预测两个部分。帧内预测通过利用一帧图像内部的空间上像素的相关性,进而达到去除冗余信息的目的。帧间预测利用运动图像相邻帧之间时间上的相关性,去除视频序列时间上的冗余信息。变换量化是将预测残差进行处理去除空间信号的相关性,从而将视频数据进一步压缩。熵编码主要是去除信源中的信息熵冗余,将变换量化后的视频序列的信息转化为易于存储和传输的压缩码流。
天津大学硕士学位论文3)变换单元(Transform Units,TU)是进行变换和量化的基本单元,是在 CU的基础上划分的,但受到所在的预测单元 PU 块大小的限制。在帧内编码模式中TU 块尺寸小于等于 PU 尺寸,在帧间编码模式中可以大于预测单元,当 PU 块是规则划分时,TU 必须为正方形,当 PU 块采用非规则 AMP 划分模式时 TU 为条带状,四叉树单元块划分具体表现形式为图 2-2 所示。
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN919.81
【参考文献】
相关期刊论文 前2条
1 黄铁军;;AVS2标准及未来展望[J];电视技术;2014年22期
2 陈佐;陈汉;季加良;;运动估计搜索算法的CUDA优化与实现[J];计算机工程与应用;2010年32期
相关硕士学位论文 前2条
1 徐荣飞;HEVC编解码算法的CUDA优化[D];北京邮电大学;2013年
2 韦轶群;基于GPU硬件加速的医学图像分割研究[D];上海交通大学;2009年
本文编号:2649134
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2649134.html