当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的漫画风格迁移方法研究

发布时间:2020-04-09 01:23
【摘要】:在图像处理的领域之中,一些研究人员利用深度学习在处理图像风格化的方面取得了很好的效果,图像风格化就是将一张普通照片在内容不变的情况下生成具有另外一种风格的图像。漫画的发展可以追溯到很久以前的人类社会智人时期,如今也作为一种流行的娱乐方式受到各个阶层人们的喜爱。因此,研究漫画风格化的迁移具有学术研究和实际应用价值。目前的研究结果表明,大多数的风格迁移算法的风格图都是油画等带有强烈纹理的图像,而以黑白的点线特征为主的漫画图像风格迁移却鲜少有涉及,所以本文针对漫画图像的风格迁移进行了有关研究。具体内容如下:(1)在阅读风格迁移的相关文献后,对于基于块匹配的风格迁移、基于自适应归一化的风格迁移、基于损失感知函数的风格迁移以及漫画对抗生成网络进行了实验,对比得出这四种方法在漫画风格迁移方面产生图像的质量,并分析结果,选择基于感知损失函数的模型作为本文产生漫画风格迁移模型的基础。(2)基于损失感知函数的实时风格转换,首先在原网络的基础上更改了归一化的方法。由于图像风格化中生成结果主要依赖于某个图像实例,所以运用实例归一化代替批归一化。其次,当用神经网络生成图像时,经常从低分辨率与高阶描述构建图像,这会让网络先描绘粗糙的图像,再填充细节,经常会产生棋盘状格纹。于是采用最邻近插值法进行图像的缩放,再做卷积,以这样的方式代替反卷积,可以提高生成图像的质量,远离棋盘效应的出现。(3)对神经网络不同的层提取出来的特征图进行了大量的实验分析分析,发现浅层的网络提取出的特征更加偏向于点线面,而深层网络提取出的特征更偏向于整体的纹理与风格图的整体感觉,因此选择最适合漫画风格迁移的不同卷积层的权重比例对漫画图像进行特征提取。(4)之前的大部分风格迁移模型训练都选用了最常使用的Coco数据集,Coco数据集中的图像是彩色的真实照片,为了得到更适合漫画风格的模型,本文对于漫画风格图像的迁移建立了包含一千多张标准黑白漫画图像的数据集,利用漫画数据集对模型进行训练,通过对比相同参数下不同数据集的结果,漫画数据集训练的风格迁移效果最优。(5)在Ubuntu的操作系统下,搭建了基于Python语言的Pyqt界面开发工具,利用Pyqt进行了界面的开发。该系统可以选择任意图像输入,在界面中可以选择不同的参数进行调整,对比不同参数的效果,也可以对不同的图像进行训练得到不同的漫画风格模型。
【图文】:

特征图,图像纹理,提取方法


我认为还是有必要在现有的研究中继续改进,将神经艺术算法的渲染创作中。题研究现状神经网络的图像风格迁移在 2015 年由 Gatys 等人在两篇论文中提出的,Gatys et al., 2015a[7],第二篇是 Gatys et al., 2015b[8]。在 2015 年 Gatys 等人提出了一种基于卷积神经网络特征空间的纹理模型,在这个模型中,纹理层中的特征图之间的相互关系重新呈现,在使对象信息越来越清晰的同来越多地捕捉自然图像的风格内容特征。方法正如图 1-1[7]中所示,左边神经网络,经过不同卷积层的特征提取与 Gram 矩阵的计算得出纹理分析图像输入,计算纹理在不同层的损失函数,进行纹理的合成。第二篇文献篇文献中的纹理合成的方法,进行了油画风格的图像风格迁移,作者使用网络层进行内容的重建,保留下最大的像素值部分,然后与提取到的纹理最终的含有不同油画艺术风格的图像。

模块图,模块,网络层


ResNet 残差神经网络由微软研究院的 Kaiming He 等 4 名华人提出[25],ResNet 的网结构将之前的参数都可以传递下来,对于网络的准确率也有很大的提高,ResNet 将网层数增加到 50、101 和 152,都得到了比较好的结果,但是当网络层增加到 1202 时结降低,由于网络层数太深会导致过拟合。残差网络的主要核心是将每一层信息直接传递输出,不会因为网络层数的增加导致退化的问题,在网络层数增加的基础上,准确率也得到一定的上升,保证提取到特征的完整性。VGGNet是由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深卷积神经网络[26]。如今 VGG16 和 19 仍然被应用于很多的图像特征提取问题中,网络利用了 3 3的小卷积核进行特征的提取,2 2的最大池化层进行降维。VGGNet 的网络构如下图 2-4 所示。最为常用的是 VGG16 和 VGG19,,网络大致分为五大块,每一块都几个卷积层串联,之后跟随一个最大池化,最后三个全连接层以及 softmax 分类器,VGG网络主要运用在图像特征提取方面,使用 3 3的滤波器和 2 2的池化层,通过网络的断加深可以提升网络的性能。但是网络的缺点是参数较多,需要更大的储存空间。
【学位授予单位】:西安理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP181

【相似文献】

相关期刊论文 前10条

1 张锦华;孙挺;;引入像点融合度修补的图像边缘化参差拼接实现[J];微电子学与计算机;2014年08期

2 翟逸飞;;基于FPGA的图像边缘处理研究[J];企业技术开发;2013年12期

3 顾长友;妙用Photoshop处理图像边缘[J];电脑知识与技术;2003年08期

4 濮群,余桂;用线性模型检测图像边缘[J];清华大学学报(自然科学版);1988年01期

5 宋建中;;喷雾图像的自动分析[J];光学机械;1988年04期

6 高华;;关于古建筑图像中破损点优化提取仿真[J];计算机仿真;2017年11期

7 刘娟娟;刘斌;;低照度非线性光学图像边缘自适应增强装置设计[J];激光杂志;2017年03期

8 张琳梅;;基于图像边缘增强的改进方法[J];信息系统工程;2016年03期

9 王水萍;邹蕾;;空中模糊目标图像边缘信息的融合与恢复方法[J];科技通报;2014年06期

10 朱庆生;杨世泉;柳锋;;基于图像边缘摘要的快速模板匹配[J];计算机应用研究;2009年02期

相关会议论文 前10条

1 陆成刚;陈刚;张但;闵春燕;;图像边缘的优化模型[A];'2002系统仿真技术及其应用学术论文集(第四卷)[C];2002年

2 王培珍;杨维翰;陈维南;;图像边缘信息的融合方案研究[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年

3 王亮亮;李明;高昕;;强模糊空间目标图像边缘获取方法研究[A];第九届全国光电技术学术交流会论文集(下册)[C];2010年

4 陈炜;张阳阳;孟庆勋;;一种基于Curvelet变换的图像边缘增强方法[A];国家安全地球物理丛书(十)——地球物理环境与国家安全[C];2014年

5 张明慧;;基于模糊蒙片算法的CR图像边缘增强[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年

6 孙增国;师蕊;;基于L_(1/2)范数的高分三SAR图像的非局部均值降斑[A];第五届高分辨率对地观测学术年会论文集[C];2018年

7 杨文秀;陆常周;;最优小波问题探讨[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年

8 赵恩良;姜盈帆;孙丽华;曹康敏;金瑞巧;;一种基于变窗口的图像去噪算法研究[A];第十六届沈阳科学学术年会论文集(理工农医)[C];2019年

9 周胜灵;丁珠玉;;农产品边缘检测系统研究[A];中国农业工程学会2011年学术年会论文集[C];2011年

10 胡昌伟;屈小波;郭迪;宁本德;陈忠;;基于边缘加权的l_1-l_2范数MRI欠采重建[A];第十七届全国波谱学学术会议论文摘要集[C];2012年

相关重要报纸文章 前7条

1 侯杰;国产芯片进军移动多媒体市场[N];人民邮电;2003年

2 吴飞;无边距照片打印三部曲[N];中国电脑教育报;2003年

3 成岭;消除Premiere中慢镜头的图像抖动[N];电脑报;2003年

4 ;体验决定一切[N];中国计算机报;2003年

5 Wang JS;抠图又有新招[N];电脑报;2002年

6 徐和德;从实战出发选择合适镜头[N];中国摄影报;2019年

7 ;令挑剔的人也刮目相看[N];中国电子报;2001年

相关博士学位论文 前10条

1 刘奇;基于结构保持滤波的图像去雾算法研究[D];西安电子科技大学;2018年

2 刘飞;透混沌介质偏振成像技术[D];西安电子科技大学;2016年

3 李永军;图像与视频低复杂度压缩算法研究[D];西安电子科技大学;2017年

4 何人杰;图像去雾与去湍流方法研究[D];西北工业大学;2017年

5 张文静;光场成像技术在天空偏振模式测量和湍流图像清晰化中的应用研究[D];国防科学技术大学;2016年

6 左承林;图像非局部均值去噪方法研究[D];国防科学技术大学;2016年

7 王丹;基于暗通道先验的图像和视频去雾模型及算法研究[D];国防科学技术大学;2016年

8 宋文青;SAR图像自动目标提取方法研究[D];西安电子科技大学;2018年

9 杨滨;图像克隆拼接篡改盲取证技术研究[D];湖南大学;2014年

10 张小帆;基于介观尺度的内燃机进气流场层析图像诊断机理研究[D];华南理工大学;2018年

相关硕士学位论文 前10条

1 叶显一;基于深度学习的糖尿病视网膜病变图像中渗出物的检测方法研究[D];武汉工程大学;2018年

2 张光裕;高质量图像的渐进式并行检索算法研究[D];厦门大学;2017年

3 张秀;基于单幅图像的沙尘图像清晰化方法及系统[D];西安理工大学;2019年

4 路鑫林;基于骨料形状匹配的混凝土CT图像裂纹信息提取方法研究[D];西安理工大学;2019年

5 孙利国;基于深度学习的文物图像单标签和多标签分类研究[D];浙江大学;2019年

6 李岭;图像与数据融合的抓取机构控制系统研究[D];沈阳工业大学;2019年

7 王陈;指静脉多曝光图像的研究[D];北京邮电大学;2019年

8 武筱琪;基于深度学习的漫画风格迁移方法研究[D];西安理工大学;2019年

9 余锴鑫;基于图像分类算法的自动化摘酒方法研究[D];浙江大学;2019年

10 华永祥;基于荧光靶图像的单色光位置变化测量研究[D];中国科学院大学(中国科学院上海应用物理研究所);2019年



本文编号:2620092

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2620092.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户71742***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com