基于视觉感知的HEVC优化算法研究
本文选题:HEVC + 感知视频编码 ; 参考:《华侨大学》2017年硕士论文
【摘要】:近年来,随着多媒体信息和网络技术的高速发展,高清、超高清视频应用逐步走进人们的视野,给视频数据的存储和传输带来巨大挑战。在这种背景下,联合视频编码工作组(Joint Collaborative Team on Video Coding,JCT-VC)制定了新一代视频编码标准(High Efficiency Video Coding,HEVC)。HEVC与上一代国际视频编码标准H.264相比较,编码效率提高了一倍。但是和H.264一样,HEVC依然采用基于客观失真度量标准的拉格朗日率失真优化技术去优化其编码效率。然而,一方面其采用的失真度量方法误差平方和(Sum of Square Error,SSE)和平均绝对误差(Mean Absolute Differences,MAD)与人眼视觉相关度较低,另一方面拉格朗日算子仅仅与量化参数(Quantization Parameter,QP)相关,忽略了视频内容感知特性。也就是说,HEVC在优化其编码效率时未能充分考虑人眼视觉特性。由于人眼是视频最终接受者,在HEVC中考虑人眼视觉特性以提高其编码效率具有重要意义。为此,本文将围绕基于视觉感知的HEVC优化算法展开研究工作,具体如下:首先,由于率失真优化技术中拉格朗日算子忽略视频内容的感知特性,本文提出一种感知特征引导的率失真优化方法,以提高HEVC感知编码性能。考虑视频时空特性,本算法分别对每一编码树单元分别提取空域感知特征(梯度幅值比)和时域感知特征(梯度幅值相似度偏差比)。根据提取的感知特征自适应调整拉格朗日算子以引导率失真优化的整个过程过程。实验结果显示,和原始算法相比较,所提算法可很好地改善编码视频的感知质量。其次,提出一种基于感知的HEVC帧间码率控制算法。由于人眼视觉对视频图像的边缘信息比较敏感,该算法利用梯度幅值来有效描述图像边缘结构信息,引导单元层的比特分配,分配给人眼感兴趣区域更多码率。实验结果显示,所提算法与原始HEVC码率控制算法相比较,可以获得更好的感知性能。最后,提出一种自由能理论引导的HEVC帧内码率控制算法。根据自由能理论,利用局部方差度量各编码树单元的感知敏感度。然后根据各编码树单元的感知敏感度自适应的调整单元层比特分配方案。实验结果显示,与现有最新方法相比,本算法可以有效地提高HEVC感知编码效率。综上所述,本论文所提出的基于视觉感知的率失真优化算法,充分考虑人眼视觉特性和HEVC编码器特点,根据输入视频内容的感知特性优化码率资源分配,有效地提高了HEVC感知编码效率。本文所提算法对感知视频编码的发展与实际应用具有一定的理论依据和技术支撑。
[Abstract]:In recent years, with the rapid development of multimedia information and network technology, the application of high-definition and ultra-high-definition video has gradually come into people's vision, which brings great challenges to the storage and transmission of video data.Under this background, the Joint Collaborative Team on Video coding (JCT-VCC) has developed a new generation of video coding standard, High Efficiency Video coding (HEVCN). Compared with H.264, the coding efficiency of H.264 is twice as high as that of H.264.However, like H.264, HEVC still uses Lagrange rate-distortion optimization based on objective distortion criterion to optimize its coding efficiency.However, on the one hand, the error squared sum sum of Square error sum and mean absolute error mean Absolute difference (MADs) used by the method are lower than those of human eyes, and on the other hand, the Lagrange operator is only related to the quantization parameter Quantization (QP).The video content awareness feature is ignored.That is to say, HEVC does not fully consider human visual characteristics when optimizing its coding efficiency.Since the human eye is the ultimate receiver of video, it is very important to consider the human visual characteristics in HEVC to improve the coding efficiency.For this reason, this paper will focus on the HEVC optimization algorithm based on visual perception, as follows: firstly, because the Lagrangian operator ignores the perceptual characteristics of video content in rate-distortion optimization technology,In this paper, a rate-distortion optimization method based on perceptual feature guidance is proposed to improve the performance of HEVC perceptual coding.Considering the spatio-temporal characteristics of video, the algorithm extracts spatial perceptual features (gradient amplitude ratio) and time-domain perceptual features (gradient amplitude similarity deviation ratio) for each coding tree unit, respectively.According to the extracted perceptual features, the Lagrange operator is adaptively adjusted to guide the whole process of rate-distortion optimization.The experimental results show that compared with the original algorithm, the proposed algorithm can improve the perceptual quality of the coded video.Secondly, a perceptual rate control algorithm for HEVC interframe is proposed.Because human vision is sensitive to the edge information of video images, the gradient amplitude is used to effectively describe the edge structure information of the image, to guide the bit allocation of the unit layer, and to assign more bits to the region of interest to the human eye.Experimental results show that compared with the original HEVC rate control algorithm, the proposed algorithm can achieve better perceptual performance.Finally, a free energy guided HEVC intra-frame rate control algorithm is proposed.According to the free energy theory, local variance is used to measure the perceptual sensitivity of each coding tree unit.Then the cell layer bit allocation scheme is adaptively adjusted according to the perceptual sensitivity of each coding tree unit.Experimental results show that the proposed algorithm can effectively improve the efficiency of HEVC perceptual coding.To sum up, the proposed rate-distortion optimization algorithm based on visual perception in this paper fully considers the human visual characteristics and the characteristics of HEVC encoder, and optimizes bit rate resource allocation according to the perceptual characteristics of input video content.The efficiency of HEVC perceptual coding is improved effectively.The proposed algorithm has some theoretical basis and technical support for the development and practical application of perceptual video coding.
【学位授予单位】:华侨大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN919.81
【相似文献】
相关期刊论文 前10条
1 任晓明;薛青;郑长伟;;虚拟驾驶员视觉感知模型研究[J];计算机应用研究;2012年07期
2 刘利刚;;打造学术一流的联合实验室——浙江大学视觉感知教育部-微软重点实验室[J];计算机教育;2007年11期
3 柯尔挺;厉力华;刘伟;徐伟栋;张娟;张凌男;ZHENG Bin;;基于视觉感知信息的乳腺钼靶肿块检测分析与自动提取[J];中国生物医学工程学报;2014年01期
4 魏政刚,袁杰辉,蔡元龙;一种基于视觉感知的图像质量评价方法[J];电子学报;1999年04期
5 杨建国,肖永剑,王兆安;交通微观仿真中的驾驶员视觉感知模型[J];系统仿真学报;2005年10期
6 周静;;富士施乐开发出基于人类视觉感知的全新图像编辑技术[J];计算机与网络;2014年14期
7 辜小花;;基于视觉感知和边缘保持的光照不变人脸识别[J];电子学报;2013年08期
8 刘明晶,叶懋冬,刘国栋,李澄清;一种基于视觉感知的图像质量评价方法[J];计算机工程与设计;2005年02期
9 毕雁冰;;可行区域视觉感知的一种设置方法[J];机电产品开发与创新;2008年01期
10 陶超;谭毅华;蔡华杰;田金文;;符合人类视觉感知的图像对象分割方法[J];计算机工程;2010年24期
相关会议论文 前5条
1 王书荣;;眼睛运动及其对视觉感知的影响[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
2 薛青;徐文超;郑长伟;刘永红;;基于有限理性的虚拟视觉感知因子分析[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
3 杨敏;梁玮;李善青;贾云得;;一种基于交互式学习的穿戴视觉感知方法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
4 蒲翠翠;孟放;姜秀华;高慧;;一种基于视觉感知的视频质量客观评价方法[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
5 廖毅;程志全;党岗;;一种基于显著性分析的网格分割算法[A];中国图学新进展2007——第一届中国图学大会暨第十届华东六省一市工程图学学术年会论文集[C];2007年
相关重要报纸文章 前2条
1 田学科;原有记忆会降低视觉感知能力[N];科技日报;2011年
2 刘孝沅;用视觉感知的新闻[N];中国新闻出版报;2003年
相关博士学位论文 前10条
1 叶鹏;基于视觉感知的风格可视化研究[D];苏州大学;2016年
2 李彦胜;生物视觉感知启发下的目标检测与识别技术研究[D];华中科技大学;2015年
3 杨恒伏;结合视觉感知的图像认证与数据隐藏算法研究[D];湖南大学;2009年
4 聂一鸣;高速公路自主驾驶汽车视觉感知算法研究[D];国防科学技术大学;2012年
5 郑雅羽;基于视觉感知的H.264感兴趣区域编码研究[D];浙江大学;2008年
6 向遥;基于视觉感知的图像处理方法研究[D];中南大学;2011年
7 杨文璐;视觉感知模型与编码算法研究[D];上海交通大学;2008年
8 杜兴;视觉感知机制启发的人脸识别方法研究[D];重庆大学;2012年
9 于江波;视觉感知计算模型若干问题的研究及其应用[D];北京交通大学;2007年
10 沈云涛;基于视觉感知特性的图像检索研究[D];西北工业大学;2005年
相关硕士学位论文 前10条
1 肖燕霞;基于视觉感知的行为识别方法的研究与实现[D];电子科技大学;2014年
2 周圣云;基于视觉感知的室内场景识别与理解[D];电子科技大学;2015年
3 范允易;轻量级的三维树木构建技术及应用[D];浙江工业大学;2012年
4 康年锦;一类基于视觉感知机理的隐写算法研究[D];福州大学;2013年
5 南宇川;基于视觉感知理论的山岳型风景区建筑设计方法研究[D];天津大学;2014年
6 田子龙;基于视觉感知的严寒地区老年建筑立面开窗形式设计研究[D];沈阳建筑大学;2016年
7 王忠霄;基于视觉感知的视频编码算法研究[D];中国计量大学;2016年
8 王典;基于视觉感知的神经计算模型及其应用研究[D];杭州电子科技大学;2016年
9 杨爱胜;基于视觉感知的HEVC优化算法研究[D];华侨大学;2017年
10 汤毓婧;基于人脑视觉感知机理的分类与识别研究[D];南京理工大学;2009年
,本文编号:1774212
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1774212.html