基于深度学习的图像风格迁移研究与应用
发布时间:2021-07-04 16:14
绘画是艺术创作重要的视觉表现形式之一,而绘画风格可以用于表现绘画的文化创作背景和艺术特征,是各门类艺术绘画派系最直接的特征表现。在过去,艺术绘画的创作需要训练有素的专业人员和大量的时间。随着计算机技术的发展,借助计算机的图像处理能力可以出色地完成图像艺术创作的任务。传统的图像风格迁移方法在视觉效果上难以符合实际应用的要求,而深度学习的出现很大程度上改变了这种状况。其中,卷积神经网络是目前在图像处理方面功能最强大、效果最好的模型,能够有效地提取图像中的高层抽象特征表示,极大地提升了图像风格迁移的艺术视觉效果。然而,深度学习是一个重量级的机器学习算法,拥有着庞大的超参数空间,在实际应用中对计算效率的要求苛刻。这很大程度上限制了基于深度学习的图像风格迁移方法在工业应用中的进一步推广。另外,深度学习的内部仍然是一个黑盒,其超参数空间的数学意义目前仍无法理解。这对进一步提升图像风格迁移的视觉效果增加了极大的难度。本文对目前主要的基于深度学习的图像风格迁移方法进行了深入研究与探讨,发现并提出了相关问题的改善方法。本文的主要工作包含以下三个方面:(1)本文系统地描述了基于深度学习的图像风格迁移方法的...
【文章来源】:广东工业大学广东省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
Gatys的图像风格迁移
第一章 绪论人们各式各样的需求。在传统的图像风格迁移方法中,风格迁移的实现着重于物体模型的绘制和图像纹理的合成。Efros 等人[5]提出了一种简单地通过对样本纹理进行拼接和重组以合成新纹理的算法。Hertzmann 等人[6]提出了一种基于类推思想的方法,该方法通过图像类比特征的映射关系合成具有新纹理的图像。张海嵩等人[7]运用多层纹理阵列、国画光照模型、提取轮廓线等模块,实时绘制 3D 中国画效果的山峦场景。钱小燕等人[8]提出了一种邻域一致性度量方法,通过把统计特性引入相似性度量中,以提高图像匹配点搜索的效率。虽然,这些方法在处理结构简单的图像上已经获得了可观的效果,但是在处理颜色和纹理较复杂的图像时,产生的效果难以符合实际需求。而深度学习的出现彻底改变了这种状况,极大地推动了图像风格迁移的发展。
图 2-1 VGG-19 模型Fig 2-1 VGG-19 model网络模型相比,VGG 模型的准确度显著提升,而且大幅度减少了网络训练参数,因而受到了广泛的关注。在 VGG 模型中总共有 6 种网络模型参数的配置方法,每一种配置方法在结构上非常相似。其中,VGG-16 和 VGG-19 的模型性能较好,卷积神经网络层之间直接通过 1*1 的卷积核进行堆叠相连,能够以较小的计算代价增加了非线性的超参数空间,大大加强了模型的特征分层能力。Gatys 等人最早将预训练的 VGG-19 模型作为特征提取器,具体模型如图 2-1 所示。给定的输入图像在特征提取器的中间层中会被处理成一组滤波特征向量,即抽象特征表示。图像特征可以通过仅知道特定中间层的抽象特征表示来进行重建,以此来可视化神经网络模型中不同层对于图像信息的处理方式。在 VGG-19 卷积神经网络模型中,常用于重构图像内容特征的中间层有’conv4_2’,常用于重构图像风格特征的中间层有’conv1_1’ ,’conv2_1’, ’conv3_1’,’conv4_1’,’conv5_1’。这些中间层能够有效地
【参考文献】:
期刊论文
[1]深度学习应用技术研究[J]. 毛勇华,桂小林,李前,贺兴时. 计算机应用研究. 2016(11)
[2]快速风格迁移[J]. 钱小燕,肖亮,吴慧中. 计算机工程. 2006(21)
[3]实时绘制3D中国画效果[J]. 张海嵩,尹小勤,于金辉. 计算机辅助设计与图形学学报. 2004(11)
本文编号:3265113
【文章来源】:广东工业大学广东省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
Gatys的图像风格迁移
第一章 绪论人们各式各样的需求。在传统的图像风格迁移方法中,风格迁移的实现着重于物体模型的绘制和图像纹理的合成。Efros 等人[5]提出了一种简单地通过对样本纹理进行拼接和重组以合成新纹理的算法。Hertzmann 等人[6]提出了一种基于类推思想的方法,该方法通过图像类比特征的映射关系合成具有新纹理的图像。张海嵩等人[7]运用多层纹理阵列、国画光照模型、提取轮廓线等模块,实时绘制 3D 中国画效果的山峦场景。钱小燕等人[8]提出了一种邻域一致性度量方法,通过把统计特性引入相似性度量中,以提高图像匹配点搜索的效率。虽然,这些方法在处理结构简单的图像上已经获得了可观的效果,但是在处理颜色和纹理较复杂的图像时,产生的效果难以符合实际需求。而深度学习的出现彻底改变了这种状况,极大地推动了图像风格迁移的发展。
图 2-1 VGG-19 模型Fig 2-1 VGG-19 model网络模型相比,VGG 模型的准确度显著提升,而且大幅度减少了网络训练参数,因而受到了广泛的关注。在 VGG 模型中总共有 6 种网络模型参数的配置方法,每一种配置方法在结构上非常相似。其中,VGG-16 和 VGG-19 的模型性能较好,卷积神经网络层之间直接通过 1*1 的卷积核进行堆叠相连,能够以较小的计算代价增加了非线性的超参数空间,大大加强了模型的特征分层能力。Gatys 等人最早将预训练的 VGG-19 模型作为特征提取器,具体模型如图 2-1 所示。给定的输入图像在特征提取器的中间层中会被处理成一组滤波特征向量,即抽象特征表示。图像特征可以通过仅知道特定中间层的抽象特征表示来进行重建,以此来可视化神经网络模型中不同层对于图像信息的处理方式。在 VGG-19 卷积神经网络模型中,常用于重构图像内容特征的中间层有’conv4_2’,常用于重构图像风格特征的中间层有’conv1_1’ ,’conv2_1’, ’conv3_1’,’conv4_1’,’conv5_1’。这些中间层能够有效地
【参考文献】:
期刊论文
[1]深度学习应用技术研究[J]. 毛勇华,桂小林,李前,贺兴时. 计算机应用研究. 2016(11)
[2]快速风格迁移[J]. 钱小燕,肖亮,吴慧中. 计算机工程. 2006(21)
[3]实时绘制3D中国画效果[J]. 张海嵩,尹小勤,于金辉. 计算机辅助设计与图形学学报. 2004(11)
本文编号:3265113
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3265113.html
最近更新
教材专著