当前位置:主页 > 科技论文 > 网络通信论文 >

基于内容分析的图像视频编码研究

发布时间:2018-08-30 18:38
【摘要】:数字图像视频的压缩技术已经研究超过二十年,并取得了巨大的成功。然而,多年的开发使得以“预测-变换”为主的传统编码框架越来越接近其性能极限。我们有必要从新的角度分析并理解数字图像视觉内容,开发新的编码压缩方法。最近十年中,计算机视觉领域的快速发展启发我们可以从视觉内容分析出发,发掘图像的视觉相关性,改进图像视频编码性能。 在本论文中,我们重点研究视觉内容分析技术与图像视频编码技术的结合,借助视觉内容分析技术对图像间视觉相关性进行分析,消除图像和视频中不同层面的视觉冗余,从而提高图像视频的编码效率。本论文的主要贡献可以总结为三个部分的工作。 在第一部分工作中,我们提出了一种基于视觉模式分析的图像编码方法。该方法通过先验视觉模式描述图像低频和高频之间的视觉相关性,并由此自适应地在编码端丢弃图像中的某些高频视觉冗余,改善编码性能。同时在解码端,根据视觉模式包含的先验信息估计并恢复丢失的高频细节,改善图像重建质量。此外,我们进一步地将基于视觉模式的分析技术扩展至可伸缩视频编码应用,提出了一种新的基于视觉模式分析的层间预测方法。该方法借助视觉模式的搜索和映射,同时发掘可伸缩视频序列在时域和空域的视觉相关性,分别生成两个高质量的层间预测信号,改善可伸缩视频编码性能。此外,我们还采用了基于参数分析的预测方法,通过分析基本层已编码的信息(比如HEVC编码中的四叉树信息)来实现复杂度较低的层间预测。我们的方法通过结合多种内容分析机制,同时提供了多环路和单环路的系统实现,在编码性能和复杂度之间取得更好的平衡。 在第二部分的工作中,我们提出了一种基于图像特征的高效图像编码方法。该方法通过图像局部特征匹配建立起更紧密的图像局部视觉联系,再配合像素层面的相关性分析,更有效地消除视觉冗余。具体地说,我们利用多尺度小波变换和SIFT特征提取,首先将输入图像分解为全局信息和子带内局部信息,并进行编码压缩。全局信息是对输入图像的基本描述,包含有限的视觉冗余;而子带内局部信息则是从不同的小波子带中提取的SIFT局部特征。在解码端,我们利用解码的SIFT特征从云端图像数据库中,检索出一组视觉相似的图像片。然后,结合基于视觉模式的分析和映射,将这些相似图像片中的信息与解码的全局信息融合起来,重建目标图像。根据子带内SIFT特征建立的视觉联系,我们利用基于视觉模式的映射从最低频的子带开始,由低频至高频,依次将视觉相似图像片内的信息融合进入对应的子带,恢复图像不同频带内的局部细节,直到图像完整重建。我们的方法通过结合局部特征分析技术和视觉模式分析的优点,取得更高效的图像编码性能。 在第三部分的工作中,我们提出一种基于图像特征全局相似度分析的图像集整体优化编码方法。根据图像局部特征的整体统计特性,我们定义特征距离来分析图像与图像间的全局相似度。在此基础上,我们将图像集聚类为若干个相关性更强的子集,并将每个子集中图像间的关系描述为一个加权有向图。图中每个节点代表一幅图像,每一条边由特征距离加权。通过寻找该有向图的最小权值生成树,可以得到具有最小预测代价的优化编码结构。为了进一步增强图与图之间的相关性,我们提出了一种全新的基于特征的图像间三步预测方法。首先,我们利用SIFT特征匹配和多模型几何运动估计,消除不同区域的几何形变。其次,我们引入光度变换消除图像间由于光照变化带来的差异。最后,我们利用基于块的运动补偿机制生成局部优化的预测信号。我们提出的基于图像特征的方法充分利用多种内容分析技术的优点。基于特征的全局分析技术有效地确定了优化编码结构;基于局部特征匹配的图像变换增强了图像与图像间的区域相关性;基于像素的运动补偿生成了更精确的预测信号。因此,我们的方法有效地发掘了相关图像间的视觉冗余,提高了图像集整体编码的效率,同时为进一步研究大数据和云存储环境中的大尺度图像视频编码提供了新的思路。
[Abstract]:Digital image and video compression technology has been studied for more than 20 years and has achieved great success. However, many years of development have made the traditional coding framework based on "prediction-transformation" approach its performance limit more and more. The rapid development of computer vision in the last decade has inspired us to explore the visual correlation of images and improve the performance of image video coding based on visual content analysis.
In this paper, we focus on the combination of visual content analysis technology and image video coding technology. We use visual content analysis technology to analyze the visual correlation between images, eliminate visual redundancy at different levels in images and videos, so as to improve the coding efficiency of images and videos. Part of the work.
In the first part of our work, we propose an image coding method based on visual pattern analysis. This method describes the visual correlation between low and high frequencies of an image by a priori visual pattern, and thus adaptively discards some high frequency visual redundancy in the image at the coding end to improve the coding performance. In addition, we extend the analysis technique based on visual pattern to the application of scalable video coding, and propose a novel inter-layer prediction method based on visual pattern analysis. By mapping, the visual correlation of scalable video sequences in time domain and space domain is explored, and two high-quality inter-layer predictive signals are generated to improve the performance of scalable video coding. Our approach achieves a better balance between coding performance and complexity by combining multiple content analysis mechanisms and providing a multi-loop and single-loop system implementation.
In the second part of the work, we propose an efficient image coding method based on image features. This method establishes a closer local visual relationship through image local feature matching, and then combines the correlation analysis of pixel level to eliminate visual redundancy more effectively. Specifically, we use multi-scale wavelet transform. In SIFT feature extraction, the input image is decomposed into global information and local information in sub-band, and then encoded and compressed. SIFT features are used to retrieve a set of image slices with similar vision from cloud image database. Then, combined with the analysis and mapping based on visual pattern, the information in these similar image slices is fused with the decoded global information to reconstruct the target image. This method combines the advantages of local feature analysis and visual pattern analysis to achieve higher efficiency. Image coding performance.
In the third part, we propose an image set global optimization coding method based on global similarity analysis of image features. According to the global statistical characteristics of local features, we define feature distance to analyze the global similarity between images. On this basis, we cluster image sets into several correlations. Each node in the graph represents an image and each edge is weighted by the feature distance. By searching for the minimum weight spanning tree of the directed graph, the optimal coding structure with the minimum prediction cost can be obtained. In order to further enhance the graph and the graph. Firstly, we use SIFT feature matching and multi-model geometric motion estimation to eliminate geometric deformation in different regions. Secondly, we introduce photometric transformation to eliminate the difference between images caused by illumination changes. Motion compensation mechanism generates locally optimized predictive signals. The proposed image feature-based method makes full use of the advantages of various content analysis techniques. Feature-based global analysis techniques effectively determine the optimal coding structure; and image transformation based on local feature matching enhances the regional correlation between images and images. Therefore, our method effectively exploits the visual redundancy between related images, improves the overall coding efficiency of the image set, and provides a new idea for further research on large-scale image video coding in large data and cloud storage environment.
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:TN919.81

【相似文献】

相关期刊论文 前10条

1 汪滨,王有德;扩散泵振动对SEM的影响与消除振动[J];真空科学与技术;1990年01期

2 王俊一,王乘,孙涛;小波变换阈值选取的博弈与图像边缘点检测[J];微机发展;2005年04期

3 李东旭;;Delphi实现图像边缘检测[J];电脑编程技巧与维护;2009年S1期

4 周颢,戚飞虎;一种新的图像边缘检测算法[J];计算机工程;2003年18期

5 周舒;;基于数学形态学的图像边缘检测研究[J];科教文汇(上旬刊);2008年08期

6 曾友州;胡莹;曾伟一;郑晓霞;;提取数字图像边缘的算法比较[J];成都航空职业技术学院学报;2009年04期

7 黄炯;图像边缘处理[J];电视字幕.特技与动画;2000年09期

8 张玉明,许曼;B超图像边缘增强技术的实现方法[J];电子技术;1997年09期

9 刘刚;韩建栋;;一种新的基于梯度的2*图像插值算法[J];红外技术;2006年06期

10 胡德明;;一种基于模糊梯度算法的图像边缘检测方法[J];武汉理工大学学报(信息与管理工程版);2006年07期

相关会议论文 前10条

1 黄晓山;;数字图像处理及其在医学上的应用[A];2009年浙江省医学工程学术年会论文汇编[C];2009年

2 薛玉涵;钱亮;鞠浩;;基于模糊噪声配套图像的去运动模糊方法[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年

3 陈春宁;田睿;王毅楠;;基于色差插值的BAYER格式图像色彩复原实现[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年

4 罗强;任庆利;;基于局部IFS理论提取图像边缘[A];第十二届全国图象图形学学术会议论文集[C];2005年

5 徐庆伟;刘洲峰;李春雷;;一种基于小波变换的图像边缘检测算法[A];第十四届全国图象图形学学术会议论文集[C];2008年

6 蒋奇;高瑞;王雷;;管道漏磁场影响因素的研究[A];2005中国控制与决策学术年会论文集(下)[C];2005年

7 陆成刚;陈刚;张但;闵春燕;;图像边缘的优化模型[A];'2002系统仿真技术及其应用学术论文集(第四卷)[C];2002年

8 卢汉明;高德俊;;基于多尺度变换相结合的图像增强算法[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年

9 项昱晖;江开勇;夏涛;;基于动态域值的鞋帮图像边缘提取方法[A];2005年中国机械工程学会年会第11届全国特种加工学术会议专辑[C];2005年

10 项昱晖;江开勇;夏涛;;基于动态域值的鞋帮图像边缘提取方法[A];2005年中国机械工程学会年会论文集第11届全国特种加工学术会议专辑[C];2005年

相关重要报纸文章 前10条

1 ;B超术语解释[N];农村医药报(汉);2008年

2 ;用三星数码DigimaxMaster软件处理照片[N];科技日报;2007年

3 陕西 瞿贵荣;彩电特殊故障检修五例[N];电子报;2007年

4 于亮、阿鲲;技术“扫”天下[N];中国计算机报;2002年

5 晶 莹;三星新推精细大屏等离子显示器[N];中国质量报;2005年

6 马骏睿 皓月;制作版画效果图片[N];中国摄影报;2007年

7 ;天敏随心录电视盒[N];中国电脑教育报;2004年

8 ;体验决定一切[N];中国计算机报;2003年

9 秦风;S9500——务实者的选择[N];中国摄影报;2006年

10 芝麻糊;扫描的一些相关技术 (1)[N];中国电脑教育报;2002年

相关博士学位论文 前10条

1 韩永华;农田图像的统计迭代分割方法研究[D];浙江大学;2011年

2 陈少波;SAR图像相干斑抑制算法研究[D];华中科技大学;2010年

3 陈玫玫;手指静脉图像的去噪与分割算法研究[D];吉林大学;2010年

4 陈国忠;SAR图像纹斑噪声抑制算法研究[D];上海交通大学;2008年

5 康文炜;冠状动脉造影图像的分割方法研究[D];吉林大学;2010年

6 邢坤;基于可见光遥感图像的典型目标识别关键技术研究及其系统实现[D];哈尔滨工业大学;2010年

7 邢坤;基于可见光遥感图像的典型目标识别关键技术研究及其系统实现[D];哈尔滨工业大学;2010年

8 李小兵;MRI图像脑肿瘤分割与EEG脑癫痫检测的研究[D];大连理工大学;2010年

9 王继阳;基于高分辨率航空遥感立体图像的建筑物三维重建技术研究[D];国防科学技术大学;2009年

10 闫子飞;面向中医舌诊的舌下静脉特征获取与分析[D];哈尔滨工业大学;2010年

相关硕士学位论文 前10条

1 王珊;X射线冠脉造影图像的血管分割方法研究[D];兰州大学;2012年

2 高星星;基于稀疏分解的SAR图像抑制斑点噪声算法的研究[D];天津理工大学;2011年

3 陈益新;基于DM6467的工件表面质量图像高速采集与处理技术研究[D];杭州电子科技大学;2012年

4 李富城;多极化SAR图像地物分类技术研究[D];解放军信息工程大学;2009年

5 关辉;基于Directionlet变换的SAR图像噪声抑制及边缘检测[D];西安电子科技大学;2010年

6 陈国强;准双曲面齿轮接触图像齿形轮廓和接触斑点的二维重构[D];河南理工大学;2010年

7 滕扬;基于改进的BP神经网络肺部CT图像的结节识别[D];吉林大学;2011年

8 李动节;嵌入式图像压缩编解码研究[D];郑州大学;2011年

9 王百超;图像PDE滤波和盲恢复技术的理论研究及其在IVUS图像处理中的应用[D];山东大学;2011年

10 锁艳;基于分水岭的SAR溢油图像快速分割算法研究[D];大连海事大学;2012年



本文编号:2213954

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2213954.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c4766***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com