基于小波变换的视频质量评价算法研究
第一章 绪论
1.1 课题的研究背景及意义
由于视频中包含着大量的、丰富的数据信息,加大了视频传输信道的压力。为了解决这一问题,在视频应用之前需要进行视频数据压缩,而如何进行压缩且能最大程度的减少视频质量的损耗这一问题备受关注。在视频相关的实际应用中,由于视频所包含的数据量比较大,所以需要对视频事先进行处理。视频一般经过编码、压缩、传输、解码等处理过程,在视频处理的过程中,由于解编码器的性能、压缩设备的性能和网络传输的速度等因素,往往会降低视频的质量,从而影响到人的感观。为了保证视频的最终感观效果,需要对失真视频进行有效的质量评价,从而根据视频质量评价的好坏对视编码器和网络传输信道的相关参数进行调整。视频质量评价的方法主要为主观视频质量评价与客观视频质量评价。其中前者的评价的效果最好,然而由于此方法需要严格的测试环境、消耗的时间较长且物资费用较贵,不易于移植到实时或大规模应用系统中。主观视频质量评价主要是让观察者在特定的环境下通过自己的视觉系统对视频质量进行主观打分,主观视频质量评价优点在于最可靠最有效,受限于受观察者的心理因素、认知水平、教育程度等因素从而影响主观评分。而客观视频质量评价方法克服了主观视频质量评价的缺点,建立相应的数学模型,对视频进行自动且有效精确的质量分值计算。所以研究出能够对失真视频进行自动化智能化分析的数学模型的客观视频质量评价算法是视频质量算法研究领域内关注的重点。可靠的视频质量评价在保证视频传输信道的服务质量(QoS)和改善用户的体验质量(QoE)中扮演着重要的角色[1]。具体来说为,在一个视频的传输系统中,通过网络的 QoS参数(如网络延时、包丢失率等)来监视网络传输的 QoS 尤其重要。同样影响视频传输中的服务质量的因素有启动延迟、视频回放和视频的质量等,最终这些将影响用户的体验质量。此外,视频的质量可用于衡量传输系统中压缩、处理和传输等部件的性能。通过选择合适的参数来控制和监视传输系统中各个部件的 QoS 的参数可以实现高性能的系统和获取良好的用户体验。
...
1.2 视频质量评价算法研究现状
在数字多媒体的应用和通信中,大量数据的产生给信息的存储和传输带来了较大的困难。当今的视频技术常采用编解码器来压缩视频信号,以实现信息在比较有限的宽带上进行有效的传输。因为实际上,人眼最终看到的是播放出的视频,因此对于经过视频系统处理过程后恢复重建后的视频的质量,人们给予了很高的关注。主要的视频质量评价方法分为主观质量评价和客观视频评价这两种。下文将对这两种方法作简单描述。主观视频质量评价算法是依靠人的主观意识判断视频质量,文献[2,3]中详细论述了主观视频像质量评价算法的过程及优缺点。主观视频质量评价方法把视频的质量划分为 Excellent、Good、Fair、Poor、Bad 五个等级,具体描述如表 1.1 所示。首先让一组非专家的观察者在一个受控的环境内,观看大约十至三十分钟的视频序列,然后对每一个视频序列进行打分,最后统计出各个视频序列的质量分值,通过一系列的计算得出平均意见分(Mean Opinion Score,MOS)。对参考视频的质量分值和失真视频质量的分值进行差值运算,得到平均主观图像质量差值,记为 DMOS(Different Mean Opinion Score,DMOS)。DMOS 分值代表着视频质量的优劣,DMOS 的值越大表明视频图像的质量越差;DMOS 的值越小表明视频图像的质量越好。下文介绍了五种主观视频评价方法。
.......
第二章 视频质量评价概述
2.1 视频基础
视频是活动图像(或活动序列),我们可以看到的视频信息实际上是由许许多多单一的画面所组成的,每一幅画面称为一帧,帧(frame)是构成视频信息的最基本和最小的单位。因为视频的每一帧的内容或多或少都有不一样的地方,所以全部的图像序列看起来就是运动的图像。数字视频就是以二进制数字“0”或“1”来表示的视频信号。数字视频来源的主要方式为:一是直接通过数字摄像机(例如 CCD 摄像机等)产生数字信号;二是经过数字化技术处理将模拟视频信号转化为数字视频信号。一个基本数字视频处理系统包括:输入 、输出、存储、通信、处理和分析等模块。各个模块都有特定的功能。数字视频由一系列的图像构成,每一幅图像为一帧。通常视频中采用的帧速率有 24fps,25fps,30fps等,即每秒钟播放 24 至 30 幅图像[35]。视频图像序列是把动态的三维景物通过观测投影到视频摄像机图像平面上的一个二维图像序列,即把光学图像信号转化为电信号。对于视频信号中的每帧中的任意一像素点,在被拍摄的景物中都有特定的某一点与之相对应。视频信号的采集常用录像机或者摄像机等工具,当拍摄一个物体时,摄像机镜头收集到物体反射的光,然后使其聚焦在摄像器件的受光面,最后经由摄像器件吧光信号变成电信号,即获取到“视频信号”。
.......
2.2 人眼视觉系统(Human Vision System, HVS)
人类通过眼睛来获取视觉信息,当光辐射刺激到人眼时,光信号经过角膜和晶状体等作用投影到视网膜上,然后经由视网膜上的光感受细胞将输光信号转换为神经电脉冲信号,,之后沿着神经纤维传递到视皮层,视皮层成物体的识别感知和理解。人眼感知到的视频一般都经过了编码、压缩和信道传输等,在这些过程中往往会造成视频的失真,需要建立符合人眼视觉系统的视频质量评价模型来调整压缩设备和信道的参数以便于提高视频的质量,因此对人眼视觉系统的研究非常重要[39,40]。人的眼睛是一个构造极其复杂的器官,如图 2-1 所示。从光学的角度研究发现,人眼好比一台自动控制的照相机。它主要由角膜、瞳孔、晶状体、视网膜、虹膜和巩膜等构成[41]。角膜是附着在眼球前部的含有丰富神经的透明组织,与其相反的是包围着眼球的剩余部分的不透明的巩膜。虹膜呈环状,位于晶状体前方,瞳孔位于虹膜的中央。晶状体位于瞳孔的后方,功能好比相机镜头。当人观察某一物体时,物体反射的光线进入人眼,首先接触的是最前入哨口角膜,然后通过瞳孔,虹膜的环状肌的作用为调整瞳孔的大小以控制进入人眼的光通量,类似相机光圈调节,最后光线到达晶状体。晶状体起着相机镜头的作用,改变焦距,使不同距离景物都可以在视网膜上成像。视网膜上的视网神经能把光线的刺激转变成神经信息,然后通过神经将这些信息信号传递给大脑皮层,这样人类就可以认知和理解物体,形成视觉。
.......
第三章 基于小波域和时域的视频质量评价........19
3.1 引言....... 19
3.2 图像区域划分... 20
3.3 向量距离公式... 21
3.4 视频质量评价算法....... 22
3.5 实验....... 26
3.6 本章小结..... 31
第四章 基于小波低频系数和显著信息的视频质量评价......32
4.1 引言....... 32
4.2 运动估计与运动补偿... 33
4.3 显著信息的提取..... 34
4.4 视频质量评价算法....... 35
4.5 实验....... 40
4.6 本章小结..... 42
第五章 主要结论与展望....43
5.1 主要结论..... 43
5.2 展望....... 43
第四章 基于小波低频系数和显著信息的视频质量评价
4.1 引言
随着视频点播、数字电视、视频会议 、网络传说视频流等网络视频相关应用的快速发展,数字视频越来越融入到人们的日常生活中。从视频的获取终端到最终被人眼接受的过程中确保视频的质量是非常必要的。所以需要建立相应的视频质量评价方法来监视视频的传输信道的参数及其他参数,以此来降低视频的失真度。评价视频质量的方法主要为主观视频质量评价和客观视频质量评价。主观质量评价为最可靠的方法,但是需要观察者进行打分,且消耗时间长,不易控制和移植到系统应用中。客观质量评价通过设计数学模型通过计算机进行智能和自动化的对视频进行评分,这种方法易于移植到实际的应用中,所以客观视频质量评价算法的研究是人们关注的热点。比较成熟的客观视频质量评价模型有 MSE、PSNR、SSIM 和 MSSIM 等,这些模型尽管计算简单,但是忽略了观察者的条件和人眼视觉系统的特性。Han 等[68]针对移动视频流通过提取视频的运动矢量,然后对运动矢量建立拉普拉斯模型,然后利用运动矢量的直方图进行视频质量评价。张富强等[69]运用四元数把像素的亮度信息、色度信息、边缘能量信息以及残差能量信息结合起来用四元数进行表示,之后进行奇异值分解,然后运用失真块的熵值进行视觉感兴趣加权得到视频质量评价指标。卢等[70]利用三维多尺度 Gabor 滤波器对视频进行分解,然后从空时带通信号的运动估计、时域误差、空域误差等方向得到视频质量的评价指标。以上大部分的研究工作主要从提取视频的运动信息或者直接从评价视频图像的空域质量来对视频进行质量评价,缺乏对人眼感知的考虑,或者没有考虑到视频的运动特性,最终评价结果与主观感知的相关性仍不够接近。郑江云[71]提出了根据人眼感兴趣区域和小波系数的特点提出了一种全参考图像质量方法,本文算法在此基础上进行改进,结合了视频的运动特性,把其扩展到视频质量评价方法中。
.........
结论
随着宽带数字网络的飞速发展,超大规模集成电路技术(VLSI)和高速多媒体专用芯片的问世,各类多媒体技术在现实中的应用,视频质量评价算法的研究得到了越来越多的重视。视频质量评价算法分为主观视频质量评价算法和客观视频质量评价算法。主观视频质量评价算法通过人眼判断视频图像质量,由于过程复杂、耗时耗力、影响因素多,不适合即时应用,但是主观视频质量评价算法常用来检测客观视频质量评价算法的性能。客观视频质量评价算法由计算机自动的预测视频图像的质量,简单易用,但是客观视频质量评价算法不及主观视频质量评价算法预测准确。客观视频质量评价算法的性能好坏在于是否其预测结果与主观视频质量评价算法预测结果相一致。客观视频质量评价算法为本文的研究对象,客观视频质量评价算法又分为:全参考视频质量评价算法、半参考视频质量评价算法和无参考视频质量评价算法。本文主要研究的内容为全参考视频质量评价算法,通过研究得以下两点结论:
1、通过对“基于小波域和时域的视频质量评价算法”的研究发现:通过对视频图像的区域划分可以之后,可以根据人眼对不同区域的敏感度不同,选择不同的加权因子;小波变换可以有效的将视频图像的处理转化到频域内处理,小波变换可以有效的提取视频图像的高频信息和低频信息;欧式距离、切比雪夫距离、曼哈顿距离可以有效的衡量两幅视频图像的相似度;根据人眼对连续视频帧质量变换才在不对称感知,通过感知模型对视频的每帧质量分进行预处理,可以有效的表现出视频的特性,提高视频质量的评价效果。
2、通过对“基于小波低频系数和显著信息的视频质量评价算法”的研究发现:小波变换后的低频系数可以有效的反映视频图像的质量;通过对小波变换后的细节反变换重构的图像和提取的视频图像的显著图比较,视频图像显著图在一定程度上展现了细节系数的方面,此外也展现图像中的其他吸引注意力的区域;人眼对提出的视觉显著给予更多的关注,显著图更能好的展现出于人眼视觉系统相符的特性;运动估计和运动补偿能够更加充分的表现出视频的时域方向上的运动特性,能够更好的对视频质量进行评价。
............
参考文献(略)
本文编号:43646
本文链接:https://www.wllwen.com/wenshubaike/lwfw/43646.html