视频压缩中的高效帧间编码技术研究
本文选题:视频编码 切入点:3D视频编码 引自:《哈尔滨工业大学》2017年博士论文
【摘要】:近年来高清及超高清视频不断出现,使得以H.264/AVC和AVS为代表的第二代视频编码标准已无法满足实际应用的需要。为了提高编码效率,国际JCT-VC工作组于2013年完成新一代视频编码标准HEVC(High Efficiency Video Coding)的制定。HEVC较H.264/AVC在相同视频质量下节省了一半左右的码率。国内AVS工作组于2014年完成AVS2的制定,它与HEVC具有类似的编码性能。然而随着人们对视频质量和视频分辨率需求的不断提高,对视频编码标准的压缩效率又提出更高的要求。帧间预测因其能显著改善编码性能而在大多数视频编码标准中发挥了重要的作用。但是目前视频编码标准中普遍采用的帧间预测不能有效地处理复杂运动或者有些情况下不够准确,因此,在现有视频编码标准基础上通过增强帧间预测性能获取更高的编码效率具有重要的意义。3D视频以其能够给大家带来真实的3D场景体验和交互式地选择观看视角,引起了大家的广泛关注。作为HEVC的一个扩展,3D-HEVC主要致力于3D视频的有效压缩。除了HEVC中现有的编码工具,3D-HEVC引入了一些新的编码工具来提高多视点视频的编码性能,新的编码工具的引入导致编码端复杂度显著增加。因此,对3D-HEVC预测技术进行优化、降低3D-HEVC编码复杂度具有重要的意义。本文主要针对增强视频编码标准的帧间预测性能、优化3D-HEVC预测技术、降低3D-HEVC编码复杂度展开深入的研究。具体研究内容分为以下四个部分:第一,本文提出一个用于变形块运动信息获取的merge模式。运动估计因其能显著改善编码性能而在大多数视频编码标准中发挥了重要的作用。目前视频编码标准中普遍采用基于平移运动模型的块匹配运动估计(Block Matching Motion Estimation,BMME),它假定一个块内的所有像素都经历相同的运动。然而,BMME不能准确地描述复杂运动,比如旋转、缩放、变形。为了解决这个问题,本文提出了用于变形块运动信息获取的merge模式,它同时考虑了双线性插值模型、六参数仿射模型和四参数仿射模型。最小绝对变换差值和(Sum of Absolute Transformed Differences,SATD)准则用于为一个块选取最优模型。对于提出的merge模式,当前块的运动信息从其邻近块的运动信息获取得到。它不需要进行运动估计和传递运动参数,这有效地避免了以往解决变形运动的方案中估计和有效编码复杂运动模型包含的增多的运动参数的问题。本文提出的merge模式在HM14.0上集成。实验结果表明,与HM14.0相比,该方法以少量编解码复杂度代价对变形序列平均带来11%~18%的BD bitrate增益,对HEVC通测序列平均带来1%~3%的BD bitrate增益。第二,本文提出一个自适应维纳滤波,用于提高帧间预测准确性。帧间预测因其能显著改善编码性能而在大多数视频编码标准中发挥了重要的作用。帧间预测越准,编码效率越高。然而目前的帧间预测可能不够准确,尤其对于包含亮度变化、场景切换或者噪声的场景。为了改善帧间预测性能,本文提出自适应维纳滤波作为运动估计和运动补偿过程的附加模块。对于本文提出的自适应维纳滤波方案,每个编码单元(Coding Unit,CU)的滤波系数通过参考当前CU和其时域对应块的空域邻近重构像素在编、解码端估计得到。对于一个编码单元,只需要编码和传递一个标志位来标识是否使用提出的自适应维纳滤波。本文使用的自适应维纳滤波相比之前用于提高帧间预测准确性的线性回归模型和偏移模型,具有更强的描述能力。实验结果表明,本文提出的自适应维纳滤波方案可以进一步提升HEVC的编码性能,同时对解码复杂度的影响可以忽略。第三,本文提出一些改进方案用于优化3D-HEVC的预测技术。视差矢量(Disparity Vector,DV)的获取对视间运动预测、视间残差预测、视差补偿预测或者其它任何利用视间相关性的工具至关重要。DV用于定位当前块在另一视点中的对应块。在HTM5.0(3D-HEVC的测试版本5)中,DV从一些空域邻近块和时域邻近块获取。本文为了降低视差矢量获取过程的复杂度并获取更好的编码效率,对该过程做了一些改进。为了减少DV获取过程的内存访问带宽和复杂度提出去掉第三个时域块、对所有视点统一时域块的搜索顺序、对BR时域块加以限制。由于时域邻近块的DV比空域邻近块的DV预测准确性高,为了获取更好的编码效率,提出先从时域邻近块搜索DV。视点合成预测(View Synthesis Prediction,VSP)将邻近视点的图片映射到当前视点用于预测,用来改善多视点视频的编码性能。由于后向视点合成预测(Backward View Synthesis Prediction,BVSP)可以实现更有效的基于块的处理而被3D-HEVC所使用。为了简化3D-HEVC的视点合成预测,本文做了两个改动:统一深度图调整的邻近块视差矢量(Depth Oriented Neighboring Block Disparity Vector,Do NBDV)和BVSP过程访问的深度数据、减少邻近块视差矢量(Neighboring Block Disparity Vector,NBDV)和BVSP模式标志的存储需求。这两个改动在减少内存访问带宽和存储需求的同时没有引起总的编码性能改变。第四,本文提出一个基于3D-HEVC的纹理编码的快速编码决策。3D-HEVC编码效率的改善是以计算复杂度的增加为代价的。除了HEVC中现有的编码工具,3D-HEVC引入了一些新的编码工具来提高多视点视频的编码性能,新的编码工具的引入导致编码端复杂度显著增加。如何降低编码端复杂度成为应用中的一个关键问题。为此,本文提出一个编码纹理依赖视的快速编码决策方法,采用了两个利用视间相关性的策略加速编码决策。第一个策略是merge模式提前决策方法,第二个策略是CU划分提前终止方法。Merge模式提前决策包括两个条件:(1)五个视间邻近块的最优预测模式都是merge模式;(2)当前CU的skip模式比merge 2Nx2N模式的率失真性能好。如果上述两个条件同时满足,属于当前CU的所有预测单元(Prediction Unit,PU)只需考查merge模式而不是考查所有的预测模式。CU划分提前终止策略包括两个条件:(1)当前CU的CU划分深度等于或者大于五个视间邻近块的最大划分深度;(2)在考查所有的预测模式后,当前CU的最优预测模式是skip模式。当上述两个条件同时满足时,当前CU不需要进一步向下划分。本文将视间相关性和3D-HEVC的编码工具结合,设计了适合3D-HEVC的纹理编码的快速编码策略。实验结果表明,本文提出的快速编码决策方法可以带来47%的编码时间节省,同时带来0.1%的码率降低。
[Abstract]:In recent years, Ultra HD video and HD appear constantly, which makes the second generation video encoding standard H.264/AVC and AVS as the representative has been unable to meet the needs of practical application. In order to improve the encoding efficiency, international JCT-VC working group in 2013 to complete a new generation of video encoding standard HEVC (High Efficiency Video Coding.HEVC H.264/AVC) is the formulation of saving rate about half of the same video quality. In the domestic AVS Working Group on 2014 to complete the formulation of AVS2 and HEVC, it has similar encoding performance. However with the video quality and resolution of the increasing demand for video encoding standard compression efficiency and put forward higher requirements. Because of the significant inter prediction to improve the encoding performance and play an important role in video encoding standards. But the most commonly used video encoding standard in the inter prediction is not effective To deal with complex motion or in some cases is not accurate enough, therefore, by enhancing the inter prediction performance gets higher encoding efficiency is of great significance to the.3D video can bring you a real 3D scene experience and interactive selection of view based on the existing video encoding standard, aroused widespread concern as. An extension of HEVC, the effective compression 3D-HEVC focuses on 3D video encoding. In addition to the existing HEVC tools, 3D-HEVC introduces some new encoding tools to improve the performance of multi view video encoding, introduce new coding tools in encoding complexity increased significantly. Therefore, to optimize the forecasting technology of 3D-HEVC 3D-HEVC, reduce the complexity of encoding is of great significance. This paper focuses on the enhancement of video encoding standard inter frame prediction performance, optimization of 3D-HEVC prediction technology, reduce 3D-HEVC Further research is carried out code complexity. The specific research contents are divided into the following four parts: first, this paper presents a deformable block motion information acquisition for merge motion estimation mode. Because it can significantly improve the encoding performance and play an important role in the majority of video encoding standards. The video encoding standards commonly used in translation the motion model based on block matching motion estimation (Block Matching Motion Estimation, BMME), it is assumed that a block of all pixels that are experiencing the same movement. However, BMME cannot accurately describe the complex motion, such as rotation, zoom, deformation. In order to solve this problem, this paper proposed for deformable block motion information acquisition the merge model, it also considers the bilinear interpolation model, six parameter model and four parameter affine transform model. The minimum absolute difference and of (Sum Absolute Transformed Dif Ferences, SATD) criterion is used to select the optimal model for a block. For the proposed merge model, the motion information of moving blocks of information from its neighboring blocks obtained. It does not need to perform motion estimation and motion transmission parameters, which effectively avoids the complex number and effective encoding parameters of motion model including the in the past to solve the estimation problem of deformation movement scheme. The proposed integrated merge model in HM14.0. The experimental results show that compared with HM14.0, the method with a small amount of decoding complexity is 11%~18% BD bitrate the average price gain for the deformation sequence, measurement of HEVC sequence 1%~3% BD bitrate brings the average gain. Second. This paper proposes an adaptive Wiener filter is used to improve inter prediction accuracy. Inter prediction because it can significantly improve the encoding performance in most video encoding standards play an important The effect of inter prediction. More precisely, encoding efficiency is higher. However, the inter prediction may not be accurate, especially for containing the brightness change of scene change or noise scene. In order to improve the performance of inter frame prediction, this paper proposes an adaptive Wiener filter as an additional module of motion estimation and motion compensation for adaptive Wiener process. The filtering scheme is proposed in this paper, each encoding unit (Coding Unit, CU) of the filter coefficients by reference to the present CU and its corresponding time domain block pixels in adjacent airspace, estimated by the decoder. For an encoding unit, only need to transfer and encoding a flag indicating whether the use of the proposed adaptive Wiener filtering this paper uses the adaptive Wiener filter. Compared to the previous used to improve inter prediction accuracy of linear regression model and the offset model has better description ability of experimental results. Show that the adaptive Wiener filtering scheme is proposed in this paper can further improve the encoding performance of the HEVC, while the impact of the complexity of decoding can be ignored. Third, this paper puts forward some improvement scheme for the prediction of 3D-HEVC optimization technology. The disparity vector (Disparity Vector DV) to obtain the visual motion prediction, inter view prediction residuals, disparity compensation prediction or any other use of inter view correlation tools vital.DV used to locate the current block in another view of the corresponding block. In HTM5.0 (test version of 3D-HEVC 5, DV) from a number of adjacent blocks and adjacent airspace domain acquisition. In this paper, in order to reduce the disparity vector acquisition process complexity and obtain better encoding efficiency. The process has made some improvement. In order to reduce the DV acquisition process memory access bandwidth and complexity is proposed to remove third of all time, unified view time domain block The search order, restrictions on the BR time domain block. Because the time domain adjacent block DV high prediction accuracy than spatial adjacent block DV, in order to obtain a better encoding efficiency, put forward first search adjacent blocks DV. view from time domain synthesis prediction (View Synthesis Prediction, VSP) will point to the adjacent image maps of myopia is used to predict the current viewpoint encoding, used to improve the performance of multi view video. Due to view synthesis prediction (Backward View Synthesis Prediction, BVSP) can effectively block based processing and used by 3D-HEVC. In order to simplify the 3D-HEVC view synthesis prediction, this paper makes two changes: adjacent block disparity vector of uniform depth adjustment (Fig. Depth Oriented Neighboring Block Disparity Vector, Do NBDV) and BVSP depth data access process, reduce the disparity vectors of adjacent blocks (Neighboring Block Disparity Vector, NBDV and BVSP) The storage demand pattern marks. The two changes in the reduction did not cause the change of the encoding performance total memory access bandwidth and storage requirements at the same time. Fourth, this paper proposes a fast texture encoding 3D-HEVC encoding.3D-HEVC encoding based on the decision-making efficiency is improved at the cost of increasing the computational complexity. In addition to the existing encoding tool HEVC, 3D-HEVC introduces some new encoding tools to improve the performance of multi view video encoding, introduce new encoding tools lead to encoding complexity significantly increased. How to reduce the encoding complexity becomes a key problem in the application. Therefore, this paper puts forward a method of encoding decision as dependent texture encoding two, by using the correlation between visual encoding strategy to speed up decision-making. The first strategy is early merge mode decision method, the second strategy is the division of CU early termination Methods early.Merge mode decision includes two conditions: (1) five as between adjacent block optimal prediction mode is merge mode; (2) the CU merge 2Nx2N model skip model is better than the rate distortion performance. If the two conditions are satisfied, all belong to the current pre measurement unit CU (Prediction Unit, PU and merge) to examine the model prediction model.CU test all the division is not an early termination strategy includes two conditions: (1) CU into the current CU depth is equal to or greater than five as the maximum depth between adjacent block division; (2) in the prediction of all modes of the test, the optimal prediction model CU is skip mode. When these two conditions are met, the CU does not require a further downward division. This paper considered the correlation between 3D-HEVC and encoding tools combined with texture design, suitable for 3D-HEVC encoding fast coding strategy. The experimental results It shows that the fast coding decision method proposed in this paper can bring 47% coding time saving and 0.1% bit rate reduction.
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 徐琳;;重点项目“高效视频编码中的关键技术研究”取得重要进展[J];自然科学进展;2007年02期
2 赵珊;张玲;郑建彬;杨杰;;H.264视频编码标准[J];有线电视技术;2007年11期
3 蒋刚毅;朱亚培;郁梅;张云;;基于感知的视频编码方法综述[J];电子与信息学报;2013年02期
4 林庆帆;;视频编码的新趋势(英文)[J];西安邮电大学学报;2013年03期
5 ;我国科学家主导的视频编码标准成国际标准[J];中国标准导报;2013年07期
6 李卫平;;是否使用可伸缩视频编码(英文)[J];中国科学技术大学学报;2013年11期
7 沈兰荪,魏海,黄祥林;基于子带/小波分解的视频编码可分级性研究[J];电子学报;2000年07期
8 韦强,李晓辉,翟宗起;一种自适应快速视频编码的新方法[J];微机发展;2000年06期
9 张勇东,李桂苓;立体视频编码中视差估值算法的研究[J];电子测量与仪器学报;2002年01期
10 张勇东,李桂苓;高性能三维小波视频编码方法[J];通信技术;2002年01期
相关会议论文 前10条
1 杨任尔;陈恳;叶庆卫;;基于帧的多描述视频编码冗余插入研究[A];2009中国控制与决策会议论文集(2)[C];2009年
2 袁子立;胡世安;孟一鸣;王璀璨;;视频编码新技术新标准研究[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年
3 巫戈明;孙立峰;钟玉琢;;联合零向量预测的分布式视频编码框架[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
4 石春莺;陈伟建;;分布式视频编码的近况和未来研究方向[A];2008年中国西部青年通信学术会议论文集[C];2008年
5 杨任尔;金炜;陈恳;;基于下抽样多描述视频编码及解码后处理研究[A];第二十七届中国控制会议论文集[C];2008年
6 许鹏飞;罗建书;;率控制自组织矢量量化及在视频编码中的应用[A];第十二届全国图象图形学学术会议论文集[C];2005年
7 江涛;陈伟建;;可伸缩视频编码中运动模型的改进[A];2008年中国西部青年通信学术会议论文集[C];2008年
8 姜俊;胡骏;;新媒体视频编码方案比较研究[A];中国新闻技术工作者联合会2008年学术年会论文集(下)[C];2008年
9 刘孝波;;基于联合采样的多描述视频编码[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
10 卿粼波;吕瑞;郑敏;滕奇志;何小海;;基于迭代译码算法的分级分布式视频编码[A];第十五届全国图象图形学学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 记者 谢宏;我国主导的视频编码标准将颁为国际标准[N];科技日报;2013年
2 记者 徐建华;我国科学家主导的视频编码标准成国际标准[N];中国质量报;2013年
3 中国工程院院士 高文;智慧城市中的视频编码、分析与评测[N];中国信息化周报;2013年
4 记者 徐建华;我国新一代视频编码标准公开征求意见[N];中国质量报;2014年
5 湖北 褚达;视频编码一网打尽[N];电脑报;2003年
6 国际;第二代AVS开启国际化征程[N];中国电子报;2009年
7 周汝波 贺学金;碟机常用视频D/A转换、视频编码集成电路维修资料[N];电子报;2007年
8 中国科学院计算技术研究所,中国科学院研究生院$$ $$信息产业部“数字音视频编解码技术标准工作组”秘书长、组长 黄铁军 高文;视频编码有绝招[N];计算机世界;2003年
9 ;视频编码标准的发展[N];计算机世界;2005年
10 周汝波 贺学金;碟机常用视频D/A转换、视频编码集成电路维修资料[N];电子报;2007年
相关博士学位论文 前10条
1 张娜;视频压缩中的高效帧间编码技术研究[D];哈尔滨工业大学;2017年
2 王苫社;基于率失真优化的高效视频编码技术研究[D];哈尔滨工业大学;2014年
3 胡金晖;基于深度信息的多视点视频编码及图像增强技术研究[D];武汉大学;2014年
4 陈方栋;基于背景建模的高性能视频编码方法研究[D];中国科学技术大学;2017年
5 张江山;基于变换的视频编码与率失真分析[D];华中科技大学;2003年
6 赵安邦;稳健视频编码与传输技术研究[D];清华大学;2007年
7 杨志杰;可伸缩视频编码中的基础算法研究[D];中国科学院研究生院(软件研究所);2004年
8 张克新;可伸缩视频编码及传输理论与应用研究[D];华南理工大学;2012年
9 孟丽丽;多视点视频编码的研究[D];北京交通大学;2013年
10 王鹏;分布式视频编码率失真特性研究[D];上海交通大学;2008年
相关硕士学位论文 前10条
1 张正勇;基于高效视频编码标准中编码单元分割的样点自适应补偿算法研究[D];华东师范大学;2015年
2 赵晓荣;基于HEVC的快速编码算法研究[D];郑州轻工业学院;2015年
3 赵睿思;基于压缩感知的分布式视频编码研究[D];哈尔滨工业大学;2014年
4 刘娟;基于高性能视频编码(HEVC)算法的改进[D];东华理工大学;2014年
5 钱程;基于压缩感知的分布式视频编码的研究与实现[D];南京邮电大学;2015年
6 檀会娟;分布式视频编码相关技术的研究[D];南京邮电大学;2015年
7 聂菁;H.264/AVC快速模式选择算法研究[D];合肥工业大学;2015年
8 孟雷雷;基于参数选择的视频编码算法优化研究[D];中国计量学院;2015年
9 孙法江;多屏互动中无线传屏低延迟算法的研究[D];中国海洋大学;2015年
10 陈帅;SHVC基本层的MPEG-2扩展[D];山东建筑大学;2016年
,本文编号:1730782
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1730782.html