基于海量数据的遮挡图像补偿方法研究
发布时间:2021-03-10 19:51
近年来,伴随着相关软硬件技术的飞速发展,视觉信息采集设备迅速普及,走入大街小巷,进入千家万户。随之而来的是图像、视频等视觉数据信息的爆棚,给数据的处理和解读带来巨大压力。以监控数据为例,十数年前,也许采用人工的方式翻查监控视频还能勉力为之,而现如今已经明显成为不可能完成的任务。因此,对视觉数据进行自动分析理解成为当前备受关注的热点研究课题。本文将主要针对图像自动分析理解研究中的遮挡问题展开。目前视觉信息中占统治地位的是二维图像数据,而由于二维图像是三维客观世界向某二维平面投影而来,维度的损失必然引发遮挡问题。遮挡的存在意味着被遮挡信息的完全损失,对物体的检测、分割、识别、分类、理解等工作产生严重影响,与光照、姿态等一起成为制约相关算法性能的最主要因素。因此,解决图像遮挡补偿问题,势在必行。显而易见,被遮挡信息在图像中是完全丢失的,根据信息守恒原理,要恢复相关内容,丢失的信息必须通过某种方式进行补偿。图像的内容千变万化,不可能提前预知,所以我们选择以海量数据信息构建遮挡信息补偿模型,填补遮挡造成的信息缺损。由于涉及信息众多,采用对大数据信息具备较好建模能力的深度学习方式进行模型构建。在具...
【文章来源】:天津工业大学天津市
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
自编码器结构
天津工业大学硕士学位论文10息。解码器则需要从编码中尽可能的学习如何重建输入数据。标准自编码器的数据较为自由,变分自编码器的数据存在一些限制条件,如图2-2所示,其对瓶颈层的数据分布进行高斯函数型的一个限制。这个限制就是KL散度损失,它的目的是让均值为0,方差为1。事实上这个限制就是相当于对编码器的一个正则项,希望编码器出来的结果均有零均值。在解码器尚未训练好时,网络的重构误差较KL散度的损失来说更为严重一些。在这种情况下,一般会采取适当降低噪声,换而言之就是将KL散度损失增加,从而使得网络拟合起来容易一些;反之,如果解码器输出的结果还可以,网络的重构误差小于KL散度的损失,这时候就使KL散度的损失减少,让噪声增加,使得网络增加拟合困难性,这样解码器就要想办法提高它的解码能力了。图2-2变分自编码器结构2.1.2生成式对抗网络2014年来自加拿大蒙特利尔大学的年轻博士生IanGoodfellow和他的导师YoshuaBengio提出了生成式对抗神经网络(GenerativeAdversarialNetworks)[64],简称GANs。它是一个训练生成模型的框架,它提出时候没有晦涩的数学推演,描绘了一个动感十足的画面,契合了万物在相生相克中演化的事实。把生成式对抗神经网络想象成一幅太极图,太极生两仪,这“两仪”就好似生成式对抗神经网络的生成器和判别器,生成器负责生,判别器负责灭,一生一灭之间有了万物。生成器在初始混沌中孕育有形万物,判别器甄别过滤有形万物,扮演一种末日审判的角色。生成对抗网络被称为最具创意的想法,生成器与判别器之间的对抗可以想象成假币制造者与警察之间的猫捉老鼠游戏,假币制造者企图造出以假乱真的假币。生成式对抗神经网络的主要框架如图2-3所示,主要包括生成器(Generator)和判别器
的、真实可靠的数据集分布也输入到判别器当中,但是并不指定哪一个是模拟样本,哪一个是真实样本,判别器需要自己进行相关判定,从而确定哪一类样本是真实样本,哪一类样本是模拟样本。生成器和判别器两者实际上存在竞争关系,生成器想要生成尽可能“真”的数据,从而使判别器判定不出来,判定器则希望自己判断更加准确,可以将所有的模拟样本识别出来。然而,对抗不是主要目的,在对抗中让双方能力各有所长才是主要目的。理想情况下,生成器和判别器最终能达到一种平衡,双方都臻于完美,彼此都没有更进一步的空间。图2-3生成式对抗神经网络的框架生成式对抗神经网络基于博弈论场景,采用对抗策略进行模型训练。其中生成器通过调节自身参数,使得其生成的样本尽量难以被判别器识别出是真实样本还是模拟样本;其对手,判别器通过调节自身参数,使得其能尽可能准确地判别出输入样本的来源。具体训练时,采用生成器和判别器交替优化的方式。训练判别器的时候,需要先将生成器(·)固定,只进行正向传播不进行反向传播,然后利用随机向量z输入生成器后随机模拟的产生的样本()作为负样本,并从真实的数据中采集获得正样本X;然后将这些正样本和负样本输入判别器(·)中,根据判别器的输出()或(())与样本的标签数据进行误差的计算;最后利用得到的误差反向传播修正判别器的参数。在训练生成器的时候,需要先固定判别器(·)只进行正向传播不进行反向传播,然后利用当前生成器(·)输出的随机模拟样本(),输入到判别器(·)中;根据判别器的输出(())与样本数据标签计算的误差进行反向传播修正生成器(·)的参数。这样,生成器和判别器就构成了一个动态的“博弈过程”,这场博弈的理想情况下会达到一个纳什均衡点。这场博弈的规则如公式(2-1):
【参考文献】:
期刊论文
[1]基于自体色彩迁移的文化典藏图像修复方法[J]. 金典,裴晨,王琪. 广东印刷. 2019(03)
[2]数字图像修复技术在旧损照片修复上的应用[J]. 孙娜,刘振超. 信息记录材料. 2019(03)
[3]基于小波的图像去噪研究综述[J]. 马国兵,肖培如. 工业控制计算机. 2013(05)
[4]经典图像去噪算法研究综述[J]. 方莉,张萍. 工业控制计算机. 2010(11)
[5]基于颜色转移的照片色彩修复技术[J]. 张栋,汪世刚,吕东辉,刘书朋. 微计算机信息. 2010(23)
[6]基于多小波的图像去噪技术研究[J]. 费佩燕,郭宝龙. 中国图象图形学报. 2005(01)
硕士论文
[1]应用于古文物的数字图像修复方法研究[D]. 韩长明.吉林大学 2019
本文编号:3075188
【文章来源】:天津工业大学天津市
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
自编码器结构
天津工业大学硕士学位论文10息。解码器则需要从编码中尽可能的学习如何重建输入数据。标准自编码器的数据较为自由,变分自编码器的数据存在一些限制条件,如图2-2所示,其对瓶颈层的数据分布进行高斯函数型的一个限制。这个限制就是KL散度损失,它的目的是让均值为0,方差为1。事实上这个限制就是相当于对编码器的一个正则项,希望编码器出来的结果均有零均值。在解码器尚未训练好时,网络的重构误差较KL散度的损失来说更为严重一些。在这种情况下,一般会采取适当降低噪声,换而言之就是将KL散度损失增加,从而使得网络拟合起来容易一些;反之,如果解码器输出的结果还可以,网络的重构误差小于KL散度的损失,这时候就使KL散度的损失减少,让噪声增加,使得网络增加拟合困难性,这样解码器就要想办法提高它的解码能力了。图2-2变分自编码器结构2.1.2生成式对抗网络2014年来自加拿大蒙特利尔大学的年轻博士生IanGoodfellow和他的导师YoshuaBengio提出了生成式对抗神经网络(GenerativeAdversarialNetworks)[64],简称GANs。它是一个训练生成模型的框架,它提出时候没有晦涩的数学推演,描绘了一个动感十足的画面,契合了万物在相生相克中演化的事实。把生成式对抗神经网络想象成一幅太极图,太极生两仪,这“两仪”就好似生成式对抗神经网络的生成器和判别器,生成器负责生,判别器负责灭,一生一灭之间有了万物。生成器在初始混沌中孕育有形万物,判别器甄别过滤有形万物,扮演一种末日审判的角色。生成对抗网络被称为最具创意的想法,生成器与判别器之间的对抗可以想象成假币制造者与警察之间的猫捉老鼠游戏,假币制造者企图造出以假乱真的假币。生成式对抗神经网络的主要框架如图2-3所示,主要包括生成器(Generator)和判别器
的、真实可靠的数据集分布也输入到判别器当中,但是并不指定哪一个是模拟样本,哪一个是真实样本,判别器需要自己进行相关判定,从而确定哪一类样本是真实样本,哪一类样本是模拟样本。生成器和判别器两者实际上存在竞争关系,生成器想要生成尽可能“真”的数据,从而使判别器判定不出来,判定器则希望自己判断更加准确,可以将所有的模拟样本识别出来。然而,对抗不是主要目的,在对抗中让双方能力各有所长才是主要目的。理想情况下,生成器和判别器最终能达到一种平衡,双方都臻于完美,彼此都没有更进一步的空间。图2-3生成式对抗神经网络的框架生成式对抗神经网络基于博弈论场景,采用对抗策略进行模型训练。其中生成器通过调节自身参数,使得其生成的样本尽量难以被判别器识别出是真实样本还是模拟样本;其对手,判别器通过调节自身参数,使得其能尽可能准确地判别出输入样本的来源。具体训练时,采用生成器和判别器交替优化的方式。训练判别器的时候,需要先将生成器(·)固定,只进行正向传播不进行反向传播,然后利用随机向量z输入生成器后随机模拟的产生的样本()作为负样本,并从真实的数据中采集获得正样本X;然后将这些正样本和负样本输入判别器(·)中,根据判别器的输出()或(())与样本的标签数据进行误差的计算;最后利用得到的误差反向传播修正判别器的参数。在训练生成器的时候,需要先固定判别器(·)只进行正向传播不进行反向传播,然后利用当前生成器(·)输出的随机模拟样本(),输入到判别器(·)中;根据判别器的输出(())与样本数据标签计算的误差进行反向传播修正生成器(·)的参数。这样,生成器和判别器就构成了一个动态的“博弈过程”,这场博弈的理想情况下会达到一个纳什均衡点。这场博弈的规则如公式(2-1):
【参考文献】:
期刊论文
[1]基于自体色彩迁移的文化典藏图像修复方法[J]. 金典,裴晨,王琪. 广东印刷. 2019(03)
[2]数字图像修复技术在旧损照片修复上的应用[J]. 孙娜,刘振超. 信息记录材料. 2019(03)
[3]基于小波的图像去噪研究综述[J]. 马国兵,肖培如. 工业控制计算机. 2013(05)
[4]经典图像去噪算法研究综述[J]. 方莉,张萍. 工业控制计算机. 2010(11)
[5]基于颜色转移的照片色彩修复技术[J]. 张栋,汪世刚,吕东辉,刘书朋. 微计算机信息. 2010(23)
[6]基于多小波的图像去噪技术研究[J]. 费佩燕,郭宝龙. 中国图象图形学报. 2005(01)
硕士论文
[1]应用于古文物的数字图像修复方法研究[D]. 韩长明.吉林大学 2019
本文编号:3075188
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3075188.html
最近更新
教材专著