基于DCT域的系数分级预判与视觉优化算法研究
本文选题:H.264 + 零值量化DCT系数 ; 参考:《江西理工大学》2015年硕士论文
【摘要】:随着信息时代的发展,高清晰度的视频越来越受人们的青睐,视频编码技术也显得日益重要。H.264/AVC是VCEG和MPEG两大国际组织联合推出的视频编码标准,也是目前最流行的视频标准之一。该标准吸收了以往视频标准的优点,同时引进了多种先进的编码技术,使得其编码效率比以往标准至少提高了一倍以上。然而与此同时,也带来了大量的复杂编码运算量。因此,针对H.264/AVC视频编码算法进行性能优化,在保证编码质量的前提下降低编码的复杂度具有重要的现实意义和应用价值。本文围绕H.264/AVC标准中DCT域的编码算法,主要做了以下内容的研究工作:(1)针对运动补偿后的残差块经过4×4整数离散余弦变换(DCT)及量化过程后出现大量的零值量化系数(ZQDCT)而导致的冗余计算问题,在分析提取出最佳全零块判决阈值的基础上,结合高斯分布模型和DCT系数能量“Z”形分布特性,提出了基于该新阈值的零值量化系数分级预判算法,在残差块DCT变换之前按分级模式预判出ZQDCT,从而跳过其变换量化操作。实验结果表明,与标准算法相比,该算法明显降低了编码数据量,同时减少了最高达42%的离散余弦变换(DCT)、量化(Q)、反量化(IQ)以及离散余弦反变换(IDCT)过程计算时间。(2)结合人类视觉系统特性,将基于DCT域的恰可察觉失真(JND)模型应用于H.264标准算法中。由于人眼是视频图像的最终接收者,其对于DCT系数中低频分量具有更大的敏感性,而高频部分可能含有较多的视觉冗余系数。JND表示人眼不能察觉的最大图像失真,反映了图像中不可感知的视觉冗余信息。算法根据不同的4×4 DCT变换块计算出相应的JND阈值,对每个变换后的DCT系数进行过滤,其中对应位置比JND阈值小的DCT系数直接舍弃,从而去除视频图像中存在的主观视觉冗余。同时对舍弃后相应的DCT系数跳过其量化等操作,节省运算量。实验仿真结果表明,该JND模型能节省编码码率,同时对视频图像质量并不影响,对视频编码中的视觉冗余优化取得了良好的效果。本文通过对H.264标准中的DCT变换与量化过程的研究,利用分级预判算法将ZQDCT系数进行提前预判并跳过其DCT部分的编码,节省了运算量;另外从人类视觉系统的角度,对DCT域的视觉冗余进行了分析并提出算法进行过滤相关冗余系数,优化了编码的视频图像质量。
[Abstract]:With the development of the information age, high definition video is becoming more and more popular. Video coding technology is becoming more and more important..H.264/AVC is the video coding standard combined by two international organizations of VCEG and MPEG. It is also one of the most popular video standards at present. The advanced coding technology makes the coding efficiency more than twice as much as the previous standard. At the same time, it also brings a lot of complex coding operations. Therefore, it is of great practical significance to optimize the performance of the H.264/AVC video coding algorithm and reduce the complexity of the low coding in the premise of guaranteeing the quality of the coding. Based on the coding algorithm of the DCT domain in the H.264/AVC standard, the main research work is done in the following aspects: (1) the optimal total zero is extracted from the 4 x 4 integer discrete cosine transform (DCT) after the motion compensation and a large number of zero quantization coefficients (ZQDCT) after the quantization process. On the basis of block decision threshold, combining the Gauss distribution model and the "Z" distribution characteristic of DCT coefficient energy, a zero quantizing coefficient classification algorithm based on the new threshold is proposed. The ZQDCT is prejudged by the hierarchical mode before the DCT transformation of the residual block, and the transform quantization operation is skipped. The experimental results show that the algorithm is compared with the standard algorithm. It reduces the amount of coded data, and reduces the maximum 42% of discrete cosine transform (DCT), quantization (Q), inverse quantization (IQ) and discrete cosine inverse transform (IDCT) process computing time. (2) the exact perceptible distortion (JND) model based on the DCT domain is applied to the H.264 standard algorithm based on the characteristics of the human visual system. The human eye is a video map. The final receiver of the image is more sensitive to the low frequency component of the DCT coefficient, and the high frequency part may contain more visual redundancy.JND to represent the maximum image distortion that the human eye can't detect. It reflects the unperceived visual redundancy information in the image. The algorithm calculates the corresponding JND threshold based on the different 4 x 4 DCT transform blocks. Value, filtering the DCT coefficients after each transformation, in which the DCT coefficients with smaller corresponding positions than the JND threshold are abandoned directly, thus the subjective visual redundancy in the video image is removed. At the same time, the corresponding DCT coefficients skip their quantization and other operations to save the computation. The experimental simulation results show that the JND model can save the code rate and same code rate. It does not affect the quality of video image, and has good effect on visual redundancy optimization in video coding. Through the study of DCT transformation and quantization in the H.264 standard, the ZQDCT coefficient is prejudged in advance and skipped the coding of the DCT part by the hierarchical prejudgement algorithm, and the computation is saved. In addition, the human visual system is also obtained. From the point of view of the system, the visual redundancy in the DCT domain is analyzed, and the algorithm is proposed to filter the related redundancy coefficient and optimize the quality of the encoded video image.
【学位授予单位】:江西理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN919.81
【相似文献】
相关期刊论文 前10条
1 Patrick Neeley;;从拥有数据,到预判需求 这就是大数据的威力[J];英才;2013年05期
2 周丽峰;;新闻预判:避免同质化的“孙子兵法”[J];新闻战线;2010年11期
3 韩松;;在国际背景下预判两会热点[J];中国记者;2011年03期
4 Patrick Neeley;;从拥有数据,到预判需求 这就是大数据的威力。[J];中国经济和信息化;2012年24期
5 ;2014年广电六大发展趋势预判[J];电视工程;2014年01期
6 胡家耀;;竞争情报运作过程全剖析[J];中国畜牧业;2013年24期
7 林洪相;;典型的发现和预判[J];中国报业;2013年14期
8 郑岩;;对大学生山难报道的反思[J];当代传播;2013年01期
9 刘海鹏;;预判新闻 生产思想 提升报媒竞争力——从《齐鲁晚报》国庆报道谈新闻预判手段的运用[J];青年记者;2010年03期
10 曲雅铄;张旭升;;跟踪采访要做好“四手准备”[J];新闻传播;2007年01期
相关会议论文 前1条
1 金亚虹;陈新;;先兆信息对短角球运动模式识别和防守预判绩效的影响[A];第九届全国体育科学大会论文摘要汇编(2)[C];2011年
相关重要报纸文章 前10条
1 记者 周武英;机构对今年全球经济预判略有分歧[N];经济参考报;2014年
2 记者 汪曼莉;预判:下半年我省经济继续回升向好[N];陕西日报;2014年
3 马薪婷;选择性相信基金四季度预判[N];证券日报;2012年
4 刘毅 王治梅;早预判 强管理 快转型[N];中国城乡金融报;2013年
5 十一届全国政协经济委员会副主任 国家能源委员会专家咨询委员会主任 张国宝 本报记者 肖蔷 整理;全球能源走势的三点预判[N];中国能源报;2013年
6 中国出版传媒商报记者 刘志伟;引进版权 作者潜力如何预判[N];中国出版传媒商报;2013年
7 本报记者 曹淑彦;多数基金预判经济弱复苏[N];中国证券报;2013年
8 本报记者 洪蕾;保险业大数据:从风险预判到风险解释[N];中国电脑教育报;2013年
9 本报记者 肖红;让行业预判引领市政基础设施建设[N];中国建设报;2006年
10 本报记者 张晓敏 本报通讯员 戴伟东;天津二中院 预判预防抓“小”防“早”[N];人民法院报;2011年
相关硕士学位论文 前8条
1 温子星;预测性姿势调节对人体站立受扰后姿势响应影响的研究[D];上海体育学院;2016年
2 周莉莉;模拟预判训练对网球专项学生接发球预判能力的影响[D];北京体育大学;2016年
3 赵文刚;乒乓球专项大学生发球预判的眼动特征研究[D];成都体育学院;2016年
4 曾鹏程;基于DCT域的系数分级预判与视觉优化算法研究[D];江西理工大学;2015年
5 孙琳娜;案卷移送与法官预判之防止[D];苏州大学;2014年
6 郭明涛;不同水平女排运动员在预判任务中视觉搜索特征的研究[D];上海体育学院;2010年
7 袁向跃;不同实验材料下男子网球运动员接发球预判的眼动研究[D];天津体育学院;2012年
8 姚远;碰撞预判系统中车辆的图像雷达联合识别方法[D];清华大学;2013年
,本文编号:1828563
本文链接:https://www.wllwen.com/kejilunwen/wltx/1828563.html