基于深度学习的HDR成像方法研究
发布时间:2021-02-25 13:31
实际应用中,受限于专业设备的昂贵费用,高质量的高动态范围图像(High Dynamic Range Image,HDRI)往往很难直接获得。因此,人们主要使用软件的方法将低动态范围图像(Low Dynamic Range Image,LDRI)转化为HDR图像。使用LDR图像生成HDR图像的方法主要有两种:基于多帧LDR图像的生成方法与基于单帧LDR图像的生成方法。基于多帧的方法由于场景中的运动物体或图像不对齐等原因,容易产生鬼影、锯齿等伪影。而基于单帧的方法可以避开这些问题,故逐渐受到越来越多研究人员的关注。本文研究的内容主要为基于深度学习的单帧LDR图像生成HDR图像的方法,在HDR图像重建的过程中,需要特别关注的问题主要有两个:过曝光区域的高光抑制与欠曝光区域的噪声消除。本文认为这两个任务属于HDR图像重建过程中的两个可分离子任务,且解决方法从根本上存在区别,不适合使用同一套方法解决。因此在数据上,本文对现有研究的数据以及网络上的HDR图像进行大量采集,并精心设计了HDRI-LDRI数据集制作方式,对图像中的不同曝光水平区域根据像素值分布的规律做专门的退化操作,用于网络学习图像过...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
普通LDR图像与HDR图像对比示意
电子科技大学硕士学位论文10图2-1数码相机成像流程框图下,虽然相机本身会通过一个主动设计的暗噪声在一定程度上抵消电流噪声带来的干扰,但这仍然无法完全避免最后成像噪声的存在。当我们将LDR图像的动态范围进行拓展后,尝试去显示暗处的细节,这样噪声就会由于局部对比度的拉伸表现得相当明显,而这也是本文工作需要去解决的问题。在A/D转换的工程中,除了去除电流底噪带来的影响,相机还会对存在的坏点进行检测并剔除,之后再经过一些矫正操作,例如常见的渐晕现象(Vignetting),它是由于光传播过程中不同光路使得光的能量损失不均匀所导致的,一般来说,光线到达传感器阵列中央的距离是比到达四周的要短的,这样表现出来就是图像的中心是较亮的,越往四周像素均值越低,图像越暗,具体表现可见图2-2。最后数字信号通过一个信号放大处理,就得到了我们常见的RAW图,这个时候的RAW图像素值与环境光线的强弱呈线性关系,它与HDR图像是相当接近的,除了它没有一个足够高的动态范围。在拿到RAW图后,还需要经过相机自带的ISP(ImageSignalProcessor)的一系列操作,主要的操作包括:(1)白平衡:最基本的矫正方法主要有两种:基于灰度世界假设与基于白度世界假设,该操作是为了让人眼感知的白色在图像中也能准确呈现为白色。(2)解马赛克:一般的感光元件阵记录得到的信息是单通道的,RGB三个通道的信息呈Bayer模式排列,这就需要通过插值的方式解出对应的RGB通道的具体数值。(3)噪声抑制:将RGB三个通道补齐后,需要将相机成像过程中引入的各种噪声做进一步的抑制处理。(4)颜色空间转换:将图像信息从sensorRGB颜色空间转换至与设备无关的sRGB体系,之后可以再从sRGB体系转化为各种与显示相关的RGB体系。(5)色调映射:在得到
第二章基于单帧图像的HDR成像技术11图2-2渐晕现象。(a)均匀光线下的白墙;(b)原始图像;(c)校正后图像。调整空间,我们会在接下来的章节进行更详细的介绍。(6)图像压缩量化:将图像文件压缩为JPEG格式输出,得到最终的LDR图像。2.2HDR图像概述本节主要对HDR图像相关概念进行具体的介绍,其中包括动态范围在不同场景中的表现、HDR图像转化为LDR图像的方法并引出对HDR图像生成方法的讨论。2.2.1动态范围分辨率能够用于权衡连续信号被离散化之后的信息准确程度,对于数字图像来说,主要存在两种分辨率,一种是空间上的分辨率,即单位空间内的像素密度,另一种则是亮度上的分辨率,即记录像素信息的比特位数,其又反应了图像所能表示的最大动态范围。人眼视觉系统拥有极其优秀的亮度适应机制,这使得我们能够在相同光照场景下感受到非常广的亮度范围,能够覆盖的亮度值包括从610到8210cd/m的共1410个数量级。人眼视觉系统如此强大的亮度分辨率是众多影像记录设备所望尘莫及的,在光照条件不均匀的场景下,一般的相机无法像人眼一样同时感受到不同光照区域的信息,这些硬件设备往往只能准确记录下某个小范围亮度下的环境信息,再加上显示设备本身就存在的动态范围限制,这就使得最终设备显示的图像与人类在真实世界中所观察到的景象有所出入,使得整个视觉观感上是有着明显的区别的。为次,相关研究人员提出了HDR这一概念,HDR图像需要最大程度的解决实际场景信息与被记录场景信息的不对称问题。相对于普通的LDR图像,它能够展示出极高亮度场景的纹理与颜色细节的同时,也能兼顾到阴影区域的轮廓与色彩的清晰可辨,让人们在观赏HDR图像的时候,就基本能够获得最接近于真实场景的光照信息。其中,图像的动态范围可以被表示为式(2-2),相应
【参考文献】:
期刊论文
[1]高动态范围图像及反色调映射算子[J]. 霍永青,彭启琮. 系统工程与电子技术. 2012(04)
本文编号:3051046
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
普通LDR图像与HDR图像对比示意
电子科技大学硕士学位论文10图2-1数码相机成像流程框图下,虽然相机本身会通过一个主动设计的暗噪声在一定程度上抵消电流噪声带来的干扰,但这仍然无法完全避免最后成像噪声的存在。当我们将LDR图像的动态范围进行拓展后,尝试去显示暗处的细节,这样噪声就会由于局部对比度的拉伸表现得相当明显,而这也是本文工作需要去解决的问题。在A/D转换的工程中,除了去除电流底噪带来的影响,相机还会对存在的坏点进行检测并剔除,之后再经过一些矫正操作,例如常见的渐晕现象(Vignetting),它是由于光传播过程中不同光路使得光的能量损失不均匀所导致的,一般来说,光线到达传感器阵列中央的距离是比到达四周的要短的,这样表现出来就是图像的中心是较亮的,越往四周像素均值越低,图像越暗,具体表现可见图2-2。最后数字信号通过一个信号放大处理,就得到了我们常见的RAW图,这个时候的RAW图像素值与环境光线的强弱呈线性关系,它与HDR图像是相当接近的,除了它没有一个足够高的动态范围。在拿到RAW图后,还需要经过相机自带的ISP(ImageSignalProcessor)的一系列操作,主要的操作包括:(1)白平衡:最基本的矫正方法主要有两种:基于灰度世界假设与基于白度世界假设,该操作是为了让人眼感知的白色在图像中也能准确呈现为白色。(2)解马赛克:一般的感光元件阵记录得到的信息是单通道的,RGB三个通道的信息呈Bayer模式排列,这就需要通过插值的方式解出对应的RGB通道的具体数值。(3)噪声抑制:将RGB三个通道补齐后,需要将相机成像过程中引入的各种噪声做进一步的抑制处理。(4)颜色空间转换:将图像信息从sensorRGB颜色空间转换至与设备无关的sRGB体系,之后可以再从sRGB体系转化为各种与显示相关的RGB体系。(5)色调映射:在得到
第二章基于单帧图像的HDR成像技术11图2-2渐晕现象。(a)均匀光线下的白墙;(b)原始图像;(c)校正后图像。调整空间,我们会在接下来的章节进行更详细的介绍。(6)图像压缩量化:将图像文件压缩为JPEG格式输出,得到最终的LDR图像。2.2HDR图像概述本节主要对HDR图像相关概念进行具体的介绍,其中包括动态范围在不同场景中的表现、HDR图像转化为LDR图像的方法并引出对HDR图像生成方法的讨论。2.2.1动态范围分辨率能够用于权衡连续信号被离散化之后的信息准确程度,对于数字图像来说,主要存在两种分辨率,一种是空间上的分辨率,即单位空间内的像素密度,另一种则是亮度上的分辨率,即记录像素信息的比特位数,其又反应了图像所能表示的最大动态范围。人眼视觉系统拥有极其优秀的亮度适应机制,这使得我们能够在相同光照场景下感受到非常广的亮度范围,能够覆盖的亮度值包括从610到8210cd/m的共1410个数量级。人眼视觉系统如此强大的亮度分辨率是众多影像记录设备所望尘莫及的,在光照条件不均匀的场景下,一般的相机无法像人眼一样同时感受到不同光照区域的信息,这些硬件设备往往只能准确记录下某个小范围亮度下的环境信息,再加上显示设备本身就存在的动态范围限制,这就使得最终设备显示的图像与人类在真实世界中所观察到的景象有所出入,使得整个视觉观感上是有着明显的区别的。为次,相关研究人员提出了HDR这一概念,HDR图像需要最大程度的解决实际场景信息与被记录场景信息的不对称问题。相对于普通的LDR图像,它能够展示出极高亮度场景的纹理与颜色细节的同时,也能兼顾到阴影区域的轮廓与色彩的清晰可辨,让人们在观赏HDR图像的时候,就基本能够获得最接近于真实场景的光照信息。其中,图像的动态范围可以被表示为式(2-2),相应
【参考文献】:
期刊论文
[1]高动态范围图像及反色调映射算子[J]. 霍永青,彭启琮. 系统工程与电子技术. 2012(04)
本文编号:3051046
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3051046.html
最近更新
教材专著