基于多层结构的视频编码研究

发布时间:2018-02-11 12:08

  本文关键词: 多层编码结构 可分层视频编码 层间相关性 层间帧内模式预测 层间运动信息预测 随机访问 视频内容分析 聚类 出处:《浙江大学》2017年博士论文 论文类型:学位论文


【摘要】:多层视频编码结构是指将视频编码为多个视频层,然后利用层间预测消除不同层之间相关性的编码结构。在传统的多层编码结构中,基本层和增强层之间的视频图像是一一对应的,主要应用在可分层视频编码的空间可分层和质量可分层中。而本文提出了一种新型的多层编码结构,基本层由从视频中抽取的少量具有通用信息的图像组成,而增强层是完整的视频序列。这样的编码结构可以使得总的编码效率高于单独编码增强层的效率。换句话说,新型的多层编码结构可以用于更高效的视频编码。本文研究了基于传统多层结构的可分层视频编码和基于新型多层结构的更高效视频编码,并取得了以下创新:1、提出基于知识库的新型多层编码结构在传统的多层编码结构中,基本层图像和增强层图像一一对应。而新型的多层编码结构从对视频内容的分析出发,提取出少量的代表图像构成基本层,再通过层间预测使得总的编码效率高于单独编码增强层的效率。由于基本层的图像在编解码中需要长时间的存储供增强层参考,本文提出了基于知识库的视频编码框架,在该框架下解决了下面两个主要的技术问题:第一、研究了知识库基本层的构造问题并提出了两种构造方法。第一种,提取视频各场景的场景切换图像和随机访问图像作为关键图像,通过聚类的方法剔除关键图像中属于重复场景的图像,从而导出知识库图像,该方法在保证基本层的编码码率尽量小的情况下和待编码视频有尽量大的相关性,有利于促进视频编码的效率。第二种,对各场景的场景切换图像基于SIFT进行重复场景检测和剔除,形成基本层。然后在每个场景内部根据累积的内容变化再补充选择新的知识库图像。该方法可以和视频编码同步进行,适用于实时编码应用。第二、提出了使用知识库图像的编码方法。为了提高视频编码的效率并保证随机访问的功能,知识库图像按照全帧内的模式进行编码,知识库在随机访问点不会清空。在编解码过程中,以随机访问片段为单位参考最相似的知识库图像进行编码。最相似的知识库图像以颜色直方图差为相似度准则查找,简单高效且能保证知识库图像的预测效率。2、传统多层编码结构下的编码方法研究本文研究了传统多层编码结构下的层间预测技术,主要包括层间帧内模式预测和层间运动信息预测,使得层间的帧内模式和运动信息相关性能够得到充分的利用,从而提高增强层的编码效率和降低增强层的编码复杂度。
[Abstract]:Multi-layer video coding structure refers to the coding structure in which the video is encoded into multiple video layers, and then interlayer prediction is used to eliminate the correlation between different layers. The video images between the basic layer and the enhancement layer are one-to-one correspondence, which are mainly used in layered space and quality-layered video coding. In this paper, a new multi-layer coding structure is proposed. The basic layer consists of a small number of images with common information extracted from the video, while the enhancement layer is a complete video sequence. Such a coding structure can make the overall coding efficiency higher than that of the individual coding enhancement layer. New multilayer coding architecture can be used for more efficient video coding. In this paper, layered video coding based on traditional multi-layer structure and more efficient video coding based on new multi-layer structure are studied. The following innovations are obtained: 1. A new multi-layer coding structure based on knowledge base is proposed. In the traditional multi-layer coding structure, the basic layer image and the enhancement layer image correspond one-to-one. However, the new multi-layer coding structure starts from the analysis of video content. A small number of representative images are extracted to form the basic layer, and then the overall coding efficiency is higher than that of the single coding enhancement layer through interlayer prediction. In this paper, a video coding framework based on knowledge base is proposed. The following two main technical problems are solved under this framework: first, the construction of the basic layer of knowledge base is studied and two construction methods are proposed. The scene switching images and random access images of each scene of the video are extracted as the key images, and the images belonging to the repeated scenes in the key images are eliminated by clustering method, and the knowledge base images are derived. This method has the greatest correlation with the video to be encoded under the condition that the coding rate of the basic layer is as small as possible, which is helpful to promote the efficiency of video coding. The scene switching images of each scene are detected and culled by repeated scenes based on SIFT. A basic layer is formed. Then a new knowledge base image is added and selected within each scene according to the accumulated content changes. The method can be synchronized with video coding and is suitable for real-time coding applications. Second, In order to improve the efficiency of video coding and guarantee the function of random access, the knowledge base image is encoded according to the mode of the whole frame. The knowledge base will not be emptied at random access points. In the process of coding and decoding, the most similar knowledge base images are encoded by reference to the most similar knowledge base images in the unit of random access fragments. The most similar knowledge base images are found by using the color histogram difference as the similarity criterion. It is simple and efficient and can guarantee the prediction efficiency of knowledge base image. The traditional coding method under multi-layer coding structure is studied. In this paper, the interlayer prediction technology based on traditional multi-layer coding structure is studied. It mainly includes intra-layer mode prediction and inter-layer motion information prediction, which can make full use of the inter-layer mode and motion information correlation, thus improving the coding efficiency of the enhancement layer and reducing the coding complexity of the enhancement layer
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TN919.81

【相似文献】

相关期刊论文 前10条

1 徐琳;;重点项目“高效视频编码中的关键技术研究”取得重要进展[J];自然科学进展;2007年02期

2 赵珊;张玲;郑建彬;杨杰;;H.264视频编码标准[J];有线电视技术;2007年11期

3 蒋刚毅;朱亚培;郁梅;张云;;基于感知的视频编码方法综述[J];电子与信息学报;2013年02期

4 林庆帆;;视频编码的新趋势(英文)[J];西安邮电大学学报;2013年03期

5 ;我国科学家主导的视频编码标准成国际标准[J];中国标准导报;2013年07期

6 李卫平;;是否使用可伸缩视频编码(英文)[J];中国科学技术大学学报;2013年11期

7 沈兰荪,魏海,黄祥林;基于子带/小波分解的视频编码可分级性研究[J];电子学报;2000年07期

8 韦强,李晓辉,翟宗起;一种自适应快速视频编码的新方法[J];微机发展;2000年06期

9 张勇东,李桂苓;立体视频编码中视差估值算法的研究[J];电子测量与仪器学报;2002年01期

10 张勇东,李桂苓;高性能三维小波视频编码方法[J];通信技术;2002年01期

相关会议论文 前10条

1 杨任尔;陈恳;叶庆卫;;基于帧的多描述视频编码冗余插入研究[A];2009中国控制与决策会议论文集(2)[C];2009年

2 袁子立;胡世安;孟一鸣;王璀璨;;视频编码新技术新标准研究[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年

3 巫戈明;孙立峰;钟玉琢;;联合零向量预测的分布式视频编码框架[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年

4 石春莺;陈伟建;;分布式视频编码的近况和未来研究方向[A];2008年中国西部青年通信学术会议论文集[C];2008年

5 杨任尔;金炜;陈恳;;基于下抽样多描述视频编码及解码后处理研究[A];第二十七届中国控制会议论文集[C];2008年

6 许鹏飞;罗建书;;率控制自组织矢量量化及在视频编码中的应用[A];第十二届全国图象图形学学术会议论文集[C];2005年

7 江涛;陈伟建;;可伸缩视频编码中运动模型的改进[A];2008年中国西部青年通信学术会议论文集[C];2008年

8 姜俊;胡骏;;新媒体视频编码方案比较研究[A];中国新闻技术工作者联合会2008年学术年会论文集(下)[C];2008年

9 刘孝波;;基于联合采样的多描述视频编码[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

10 卿粼波;吕瑞;郑敏;滕奇志;何小海;;基于迭代译码算法的分级分布式视频编码[A];第十五届全国图象图形学学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 记者 谢宏;我国主导的视频编码标准将颁为国际标准[N];科技日报;2013年

2 记者 徐建华;我国科学家主导的视频编码标准成国际标准[N];中国质量报;2013年

3 中国工程院院士 高文;智慧城市中的视频编码、分析与评测[N];中国信息化周报;2013年

4 记者 徐建华;我国新一代视频编码标准公开征求意见[N];中国质量报;2014年

5 湖北 褚达;视频编码一网打尽[N];电脑报;2003年

6 国际;第二代AVS开启国际化征程[N];中国电子报;2009年

7 周汝波 贺学金;碟机常用视频D/A转换、视频编码集成电路维修资料[N];电子报;2007年

8 中国科学院计算技术研究所,,中国科学院研究生院$$ $$信息产业部“数字音视频编解码技术标准工作组”秘书长、组长 黄铁军 高文;视频编码有绝招[N];计算机世界;2003年

9 ;视频编码标准的发展[N];计算机世界;2005年

10 周汝波 贺学金;碟机常用视频D/A转换、视频编码集成电路维修资料[N];电子报;2007年

相关博士学位论文 前10条

1 王苫社;基于率失真优化的高效视频编码技术研究[D];哈尔滨工业大学;2014年

2 胡金晖;基于深度信息的多视点视频编码及图像增强技术研究[D];武汉大学;2014年

3 陈方栋;基于背景建模的高性能视频编码方法研究[D];中国科学技术大学;2017年

4 左旭光;基于多层结构的视频编码研究[D];浙江大学;2017年

5 张江山;基于变换的视频编码与率失真分析[D];华中科技大学;2003年

6 赵安邦;稳健视频编码与传输技术研究[D];清华大学;2007年

7 杨志杰;可伸缩视频编码中的基础算法研究[D];中国科学院研究生院(软件研究所);2004年

8 张克新;可伸缩视频编码及传输理论与应用研究[D];华南理工大学;2012年

9 孟丽丽;多视点视频编码的研究[D];北京交通大学;2013年

10 王鹏;分布式视频编码率失真特性研究[D];上海交通大学;2008年

相关硕士学位论文 前10条

1 张正勇;基于高效视频编码标准中编码单元分割的样点自适应补偿算法研究[D];华东师范大学;2015年

2 赵晓荣;基于HEVC的快速编码算法研究[D];郑州轻工业学院;2015年

3 赵睿思;基于压缩感知的分布式视频编码研究[D];哈尔滨工业大学;2014年

4 刘娟;基于高性能视频编码(HEVC)算法的改进[D];东华理工大学;2014年

5 钱程;基于压缩感知的分布式视频编码的研究与实现[D];南京邮电大学;2015年

6 檀会娟;分布式视频编码相关技术的研究[D];南京邮电大学;2015年

7 聂菁;H.264/AVC快速模式选择算法研究[D];合肥工业大学;2015年

8 孟雷雷;基于参数选择的视频编码算法优化研究[D];中国计量学院;2015年

9 卢晓亮;面向4K的HEVC视频编码及其在高清网络摄像机上应用的研究[D];浙江大学;2016年

10 郭健生;多视角多描述视频编码[D];北京交通大学;2016年



本文编号:1503025

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1503025.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d2b4c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com