当前位置:主页 > 科技论文 > 网络通信论文 >

可伸缩高性能视频编码的扩展技术研究

发布时间:2018-04-10 21:26

  本文选题:可伸缩高性能视频编码 + 多视角联合深度信息数据结构 ; 参考:《中国科学技术大学》2015年硕士论文


【摘要】:近年来,随着微博和微信等新型社交媒体迅速发展,网络中视频数据量急剧增加,网络带宽和存储资源的缺口越来越大,视频压缩的重要性日益凸显。2013年1月,视频编码国际标准组织JCT-VC发布了最新一代的视频编码国际标准—高性能视频编码(HEVC)。相对于上一代视频编码国际标准H.264/AVC, HEVC编码效率提升了50%。为了满足市场中对视频各种各样的需求,在标准发布的同时,JCT-VC和JCT-3V积极推进HEVC扩展版本的研究。其中主要的扩展版本包括:支持可伸缩编码的可伸缩高性能视频编码(SHVC)、支持多视角编码的多视角高性能视频编码(MV-HEVC),支持三维视频中多视角联合深度视频(MVD)数据格式的三维高性能视频编码(3D-HEVC)。多个扩展版本能够很好地满足市场需求,但在实际应用中,可能造成用户不知如何选择和使用合适的版本。如果用统一的HEVC扩展版本能够很好地应对以上几种需求,会显著提升标准的易用性。 在视频传输中,和传统的采用有状态的协议如RTSP协议相比,基于HTTP无状态的协议能够提供渐进式服务,降低了服务器和客户端的负担,提升了通信的效率,已逐渐成为市场的主流。2012年,由MPEG组织制定的基于HTTP的自适应流媒体传输技术(MPEG-DASH),能够根据网络环境和用户需求的变化动态调整多媒体资源码率,为用户提供了一个动态自适应的方法传输视频。为了支持在MPEG-DASH中的场景切换,通常需要在码流段的边界插入随机接入点。在底层编码随机接入点时,由于采用开放图片集使得场景切换点处的一些图片无法解码而产生码流中断,所以一般采用闭合的图片集的形式保证DASH场景顺利切换。 本文利用SHVC编码框架的灵活性,做了两方面的研究。一方面仅仅通过高层语法的改动,使得SHVC能够较好地编码MVD数据,从而将HEVC的主要扩展版本统一用SHVC编码。另一方面提出了在MEPG-DASH中利用SHVC提升其编码性能的方法。具体来说,本文的主要工作以及创新之处在于: 1.提出了改进的SHVC编码MVD数据框架,并在此基础上提出了分量间预测,提升了深度视频和合成视频的编码性能。由于MV-HEVC和SHVC采用的都是Reference-index-based编码结构,二者可以自然统一。采用本文提出的SHVC编码MVD数据方法,可以将HEVC三个主要的扩展版本统一用SHVC编码,提高了标准的易用性。实验表明,本文所提出的分量间预测方法在深度序列编码性能和合成性能分别提升了3.6%和1.0%,很好地去除了MVD数据中纹理-分量之间的冗余。 2.提出了三种方法使得在MPEG-DASH中,利用开发图片集编码提升MPEG-DASH编码性能的同时,避免场景切换而产生码流中断。第一种方法不需要修改标准解码器,容易获取市场认同,但编码效率提升有限。第二种方法能够很好地提升编码效率,但是需要对HEVC标准解码器做简单的修改。基于此,在本文充分利用了SHVC编码灵活性基础上,提出了第三种方法—冗余自适应分辨率切换法,很好地解决了第一种方法编码效率低的问题,同时不需要修改标准解码器。因此相对于前两种方法,第三种方法更有利于市场推广和认同。实验表明,本文提出的冗余自适应分辨率切换法相对于原来的MPEG-DASH采用闭合图片集编码,平均编码性能提升了5.6%,同时解码的图片的主观质量未有明显下降。
[Abstract]:In recent years, along with micro-blog and WeChat and other new social media rapid development, a sharp increase in the amount of video data in the network, network bandwidth and storage resources gap is more and more big, the importance of video compression has become increasingly prominent in January.2013, the video encoding of JCT-VC international standards organization released a video encoding standard - the new generation of high performance video encoding (HEVC). Compared to the previous generation of video encoding of H.264/AVC international standard, HEVC encoding efficiency of 50%. in order to meet the needs of a variety of video market, in the standard JCT-VC JCT-3V released at the same time, and actively promote the HEVC extended version of the study. The extended version mainly include: support for scalable high scalable encoding the performance of video encoding (SHVC), high performance multi view video encoding support multi view encoding (MV-HEVC), support multi view 3D video and depth video (MVD) data Three dimensional high performance video encoding format (3D-HEVC). An extended version is able to meet the market demand, but in practical application, may make users do not know how to choose and use the appropriate version. If using a unified HEVC extended version can cope well with the above requirements, will significantly enhance the ease of use standard.
In video transmission, stateful protocols such as RTSP protocol and compared with traditional HTTP, a stateless protocol can provide incremental service based on reducing the server and the client's burden, improve the efficiency of communication, has gradually become the mainstream market.2012, developed by MPEG HTTP based adaptive streaming media transmission technology (MPEG-DASH), according to the dynamic changes of network environment and user needs to adjust the rate of multimedia resources, provides a method for dynamic adaptive video transmission for users. In order to support the scene switching in MPEG-DASH, usually need to insert a random access point in the stream segment boundary. At the bottom of encoding random access point. Because of the open picture set makes some pictures the scene change point cannot be decoded and stream interruption, it is generally used in the form of closed set the picture to ensure DASH scene Switch smoothly.
Using the SHVC encoding framework flexibility this paper, do the research from two aspects. On the one hand only by changing high-level syntax, so that SHVC can better encoding MVD data, which will be the main extended version of HEVC with SHVC encoding is proposed. A unified method of using SHVC in MEPG-DASH to enhance its encoding performance. On the other hand, specifically and the main work and innovations:
1. proposed SHVC encoding MVD data frame improved, and put forward the component prediction, enhance the performance of video encoding and video synthesis depth. Because MV-HEVC and SHVC are used in Reference-index-based encoding structure, two can be naturally unified. Using SHVC MVD data encoding method proposed in this paper, the HEVC can be three the main extended version use SHVC encoding, improves usability standards. Experimental results show that the proposed component prediction method in depth sequence encoding performance and synthesis performance were improved by 3.6% and 1%, very good to eliminate the redundant data between texture component MVD.
2. this paper puts forward three ways to make use of the development in MPEG-DASH, encoding MPEG-DASH encoding images to enhance performance and avoid the scene change caused interruption. Stream first method does not need to modify the standard decoder, easy to gain market recognition, but the encoding efficiency is limited. The second methods can well improve the encoding efficiency, but need to do a simple modification of the standard HEVC decoder. Based on this, in this paper makes use of SHVC encoding based on flexibility, puts forward third kinds of method of redundancy resolution adaptive switching method, a good solution to the first method of encoding the problem of low efficiency, also do not need to modify the standard decoder. Compared to the previous two methods, more third methods for market promotion and recognition. Experimental results show that the adaptive redundancy resolution switching method is discussed with respect to the original MPEG-DASH with closed Picture set coding, the average coding performance is improved by 5.6%, while the subjective quality of the decoded images is not significantly reduced.

【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN919.81

【相似文献】

相关期刊论文 前10条

1 张勇东,李桂苓;高性能三维小波视频编码方法[J];通信技术;2002年01期

2 王维君;浅谈图像视频编码的国际标准[J];西部广播电视;2004年05期

3 南敬昌;王英博;;精细空间可伸缩视频编码方案实现[J];辽宁工程技术大学学报;2004年S1期

4 朱秀昌;视频编码新技术12题 第四讲 视频编码控制与实现(下)[J];中国数据通信;2005年06期

5 王丽丰 ,牛建伟 ,肖晨 ,胡建平;视频编码位率控制技术[J];微计算机信息;2005年20期

6 袁春,彭强;视频编码中的一种率失真模型研究与实现[J];西南科技大学学报(自然科学版);2005年03期

7 朱光喜;王溪;金欣;;一种新的视频编码变换与量化方法研究[J];计算机与数字工程;2005年12期

8 万建;柯翰冰;樊旭东;;第二代视频编码及其应用[J];有线电视技术;2008年05期

9 钟国韵;何小海;吴笛;滕奇志;;一种基于新阈值的视频编码全零块提早判决方法(英文)[J];Journal of Southeast University(English Edition);2011年03期

10 尤晶晶;王韶霞;;多媒体传感器网络分布式视频编码新算法探讨[J];辽宁科技学院学报;2013年01期

相关会议论文 前10条

1 杨任尔;陈恳;叶庆卫;;基于帧的多描述视频编码冗余插入研究[A];2009中国控制与决策会议论文集(2)[C];2009年

2 袁子立;胡世安;孟一鸣;王璀璨;;视频编码新技术新标准研究[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年

3 巫戈明;孙立峰;钟玉琢;;联合零向量预测的分布式视频编码框架[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年

4 石春莺;陈伟建;;分布式视频编码的近况和未来研究方向[A];2008年中国西部青年通信学术会议论文集[C];2008年

5 杨任尔;金炜;陈恳;;基于下抽样多描述视频编码及解码后处理研究[A];第二十七届中国控制会议论文集[C];2008年

6 许鹏飞;罗建书;;率控制自组织矢量量化及在视频编码中的应用[A];第十二届全国图象图形学学术会议论文集[C];2005年

7 江涛;陈伟建;;可伸缩视频编码中运动模型的改进[A];2008年中国西部青年通信学术会议论文集[C];2008年

8 姜俊;胡骏;;新媒体视频编码方案比较研究[A];中国新闻技术工作者联合会2008年学术年会论文集(下)[C];2008年

9 刘孝波;;基于联合采样的多描述视频编码[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

10 卿粼波;吕瑞;郑敏;滕奇志;何小海;;基于迭代译码算法的分级分布式视频编码[A];第十五届全国图象图形学学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 记者 谢宏;我国主导的视频编码标准将颁为国际标准[N];科技日报;2013年

2 记者 徐建华;我国科学家主导的视频编码标准成国际标准[N];中国质量报;2013年

3 中国工程院院士 高文;智慧城市中的视频编码、分析与评测[N];中国信息化周报;2013年

4 记者 徐建华;我国新一代视频编码标准公开征求意见[N];中国质量报;2014年

5 湖北 褚达;视频编码一网打尽[N];电脑报;2003年

6 国际;第二代AVS开启国际化征程[N];中国电子报;2009年

7 周汝波 贺学金;碟机常用视频D/A转换、视频编码集成电路维修资料[N];电子报;2007年

8 中国科学院计算技术研究所,,中国科学院研究生院$$ $$信息产业部“数字音视频编解码技术标准工作组”秘书长、组长 黄铁军 高文;视频编码有绝招[N];计算机世界;2003年

9 ;视频编码标准的发展[N];计算机世界;2005年

10 周汝波 贺学金;碟机常用视频D/A转换、视频编码集成电路维修资料[N];电子报;2007年

相关博士学位论文 前10条

1 张江山;基于变换的视频编码与率失真分析[D];华中科技大学;2003年

2 赵安邦;稳健视频编码与传输技术研究[D];清华大学;2007年

3 杨志杰;可伸缩视频编码中的基础算法研究[D];中国科学院研究生院(软件研究所);2004年

4 张克新;可伸缩视频编码及传输理论与应用研究[D];华南理工大学;2012年

5 孟丽丽;多视点视频编码的研究[D];北京交通大学;2013年

6 王鹏;分布式视频编码率失真特性研究[D];上海交通大学;2008年

7 钱大兴;基于视频内容的可伸缩视频编码的研究[D];大连理工大学;2012年

8 朱海波;可伸缩视频编码传输速率控制技术研究[D];中国科学技术大学;2013年

9 张文豪;可分级与高效视频编码中关键技术的研究[D];北京邮电大学;2010年

10 任巨;基于流计算模型的视频编码关键技术研究[D];国防科学技术大学;2010年

相关硕士学位论文 前10条

1 万卫星;分级视频编码结构及其量化技术的研究[D];中国科学技术大学;2009年

2 赵海涛;基于3D小波的多描述可分级视频编码[D];西安电子科技大学;2005年

3 王慧文;一种面向因特网的健壮视频编码方案的设计与实现[D];湖南大学;2006年

4 范钰华;分布式多描述视频编码研究[D];上海交通大学;2008年

5 毛晓菲;移动视频编码与传输关键技术研究[D];哈尔滨工程大学;2011年

6 李环环;基于分布式视频编码错误消除机制的研究与实现[D];山东科技大学;2011年

7 苏卓涵;分布式视频编码重建算法研究[D];华南理工大学;2012年

8 李志平;分布式视频编码中关键帧处理技术研究[D];南京邮电大学;2013年

9 周荣华;立体视频编码的若干问题研究[D];广东工业大学;2013年

10 张鹏;多描述分布式视频编码研究[D];西安电子科技大学;2013年



本文编号:1732982

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/1732982.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户37c8b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com