基于深度学习的图像与视频风格化研究与实现
本文关键词: 深度学习 图像风格化 卷积神经网络 迁移学习 视频风格化 出处:《中国科学院大学(中国科学院工程管理与信息技术学院)》2017年硕士论文 论文类型:学位论文
【摘要】:深度学习作为当今人工智能领域最热门的方向,在图像识别、语义分割、自然语言处理等领域取得了重大突破,显示出强大的学习和处理能力,甚至在部分领域超过人类的表现。因此,一些研究人员将深度学习应用于图像生成任务中,并在图像风格化方面取得了很好的效果。图像风格化即将一张图像在保持内容不变的同时换成另一种风格,这使得普通人也能拍出艺术风格的照片。但是当前最好的图像风格化算法在网络训练、自拍图像处理、视频风格化等方面还有很多问题需要解决,本文针对这些问题提出了对应的解决方案。(1)本文设计了一种图像风格转换网络U-StyleNet,并采用迁移学习的方法解决了网络参数初始化导致输出图像有亮块或黑块的问题,同时加快了网络的训练速度。(2)本文提出了四种方案解决自拍图像风格化人脸处理不好的问题,即设置较大的风格缩放参数、全局光滑处理、局部光滑处理、精细的风格比重。(3)本文提出了一种快速视频风格化的方案,详细介绍了快速视频风格转换网络FV-StyleNet的双通道多尺度输入结构。这种设计参考了现有的光流计算网络和图像风格转换网络,并将两者结合在一起,在风格化的同时考虑两帧图像的连续性,实现了快速而稳定的视频风格化效果。同时,双通道多尺度输入的结构具有非常高的并行性,可以充分发掘GPU的并行计算能力。FV-StyleNet同样采用迁移学习的训练方式,首先训练一个光流网络,然后在此基础上训练视频风格转换网络。本文提出的U-StyleNet成功地解决了风格转换网络参数初始化问题,同时提高了训练速度。四种优化方案提高了自拍图像风格化的质量。快速视频风格化方案FV-StyleNet极大地加速了视频的风格化,为视频风格化的应用推广创造了条件。
[Abstract]:As the most popular direction in the field of artificial intelligence, depth learning has made a great breakthrough in image recognition, semantic segmentation, natural language processing and so on, showing a strong learning and processing ability. Even in some areas it outperforms human performance. Therefore, some researchers apply in-depth learning to image generation tasks. And in the image stylization aspect has obtained the very good effect, the image stylization namely one image while keeping the content invariable at the same time changes another style. However, the best image stylization algorithm in the network training, selfie image processing, video stylization and other aspects need to be solved. This paper proposes a corresponding solution to these problems.) this paper designs an image style conversion network U-StyleNet. The migration learning method is used to solve the problem that there are bright blocks or black blocks in the output images caused by the initialization of network parameters. At the same time, it speeds up the training speed of the network.) in this paper, we propose four solutions to solve the problem of bad face processing in stylized selfie images, that is, setting larger style scaling parameters and global smooth processing. This paper presents a fast video stylization scheme. The two-channel multi-scale input structure of fast video style conversion network (FV-StyleNet) is introduced in detail. This design refers to the existing optical flow computing network and image style conversion network. Combining the two methods, the continuity of the two frames is taken into account while the two frames are stylized, and the fast and stable video styling effect is realized. At the same time, the dual-channel multi-scale input structure has a very high parallelism. We can fully explore the parallel computing power of GPU. FV-StyleNet also adopts the training method of migration learning. First, we can train an optical flow network. Then the video style conversion network is trained on this basis. U-StyleNet proposed in this paper successfully solves the problem of initialization of style conversion network parameters. At the same time, the training speed is improved. Four optimization schemes improve the quality of the stylization of the selfie image. The fast video styling scheme FV-StyleNet greatly speeds up the stylization of the video. It creates conditions for the application and promotion of video stylization.
【学位授予单位】:中国科学院大学(中国科学院工程管理与信息技术学院)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP18
【相似文献】
相关期刊论文 前10条
1 张芊;电视频道风格化建设的未来空间[J];采.写.编;2004年04期
2 彭一凡;张翼;宋明黎;;基于特征跟踪和融合的人脸风格化动画的研究[J];计算机技术与发展;2009年02期
3 陈竹;;风格化主持刍议[J];湖南科技学院学报;2006年02期
4 张宁;;非真实感渲染生成风格化图像的方法[J];信息技术;2012年11期
5 周茜,胡珊;浅析电视频道的专业化与风格化[J];山东视听(山东省广播电视学校学报);2005年03期
6 蒋宝吉;唐棣;;基于三维模型的风格化线条渲染方法[J];计算机科学;2013年10期
7 李阳;李红平;徐丹;;多变量高斯差分的风格化方法[J];云南大学学报(自然科学版);2014年03期
8 黄华;臧_g;张磊;;图像和视频油画风格化研究[J];计算机科学;2011年06期
9 邹定宾;电视频道专业化过程中的风格化问题[J];电视研究;2001年08期
10 祝瑜;王毅;黄海燕;;手机界面的风格化设计艺术研究[J];艺术与设计(理论);2007年11期
相关会议论文 前2条
1 卢少平;张松海;;一种图像油画风格化绘制的新算法[A];第四届全国几何设计与计算学术会议论文集[C];2009年
2 肖亮;钱小燕;吴慧中;韦志辉;;流线形风格化图像生成算法[A];中国图学新进展2007——第一届中国图学大会暨第十届华东六省一市工程图学学术年会论文集[C];2007年
相关重要报纸文章 前5条
1 连冕;我们何需“风格化”?[N];中国文化报;2006年
2 卞文志;市场呼唤风格化名牌[N];厂长经理日报;2000年
3 卞文志;个性化市场呼唤风格化名牌[N];市场报;2000年
4 记者 朱志升 通讯员 张明山;沙雅推行风格化社会面服务管理工作[N];阿克苏日报(汉);2012年
5 陈履生;代表性与风格化[N];文艺报;2006年
相关博士学位论文 前4条
1 赵艳丹;风格化数字图像的GPU加速生成和编辑[D];浙江大学;2015年
2 孙美君;中国水墨画的设色扩散与风格化绘制研究[D];天津大学;2009年
3 栾青;色彩与结构在图像编辑和风格化中的应用[D];中国科学技术大学;2009年
4 刘更代;人体动画合成及其风格化处理研究[D];浙江大学;2009年
相关硕士学位论文 前10条
1 郑海东;人脸风格化绘制评估方法[D];山东大学;2015年
2 杨玲丽;数字图像的风格化绘制[D];山东大学;2014年
3 高山晓;基于GPU的实时素描风格化渲染算法研究[D];福建师范大学;2016年
4 张晔嘉;三维模型风格化绘制技术研究[D];南京大学;2015年
5 操江峰;基于深度学习的图像与视频风格化研究与实现[D];中国科学院大学(中国科学院工程管理与信息技术学院);2017年
6 张小刚;风格化服装卖场系统的研究[D];江南大学;2008年
7 谢伟斌;基于稠密特征对应关系的视频风格化关键技术与系统[D];中山大学;2012年
8 肖书星;蛋白质三维结构的风格化绘制[D];浙江大学;2008年
9 林涛;基于分层稠密对应关系的视频风格化技术和系统[D];中山大学;2013年
10 陶正飞;非均匀图像卡通风格化技术研究[D];温州大学;2014年
,本文编号:1482328
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1482328.html