基于深度学习的图像美学评论研究
发布时间:2021-02-09 20:14
图像美学质量评价的研究目的是为了让计算机能够模拟人类的思维和审美对一幅图像的美学价值产生判断,从而输出评分或者文字描述。而人类的视觉和语言是紧密相连的,看到图像总能以自然语言的方式表达一些美学的见解,这些语言中包括对图像美学方面的描述例如构图、光影、色彩等,因此对图像美学进行语言描述有着非常重要的意义,然而仅有的研究中美学描述的丰富性和流畅性方面也不够完善。为了解决现有的美学描述不完善的问题,本文首先提出了名为Deep Image Aesthetic Reviewer(DIAReviewer)的模型,该模型由CNN、美学语义添加层和D-Attention组成,这种网络结构可以使最终生成的美学描述更加流畅。本文提出的美学语义添加层是将CNN提取的图像特征与从美学描述中提取的美学描述特征融合成一个混合美学特征输入到D-Attention部分。D-Attention部分将代替传统的RNN,作为模型最后的文字输出部分。为了验证提出的模型,本文还构建了新的美学字幕的数据集(ARD)。经过实验,结果表明,本文的方法在产生更加流畅的美学描述方面有一定的性能提升。其次为了解决卷积过程中导致的美学方面的...
【文章来源】:天津工业大学天津市
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
Wang等人[14]生成的图像美学描述
鳌⑸?鳌⒍员榷?和明亮度、清晰度和色彩等,以及一些图像通用的特征如SIFI(尺度不变特征变换匹配)、Hog(方向梯度直方图)、BOV(Bag-of-Visual-Words)等;与摄影相关的特征包括:三分法、景深、曝光度、构图、色彩、光线等等。在底层特征中本文首先来介绍主体背景对比特征,该特征主要遵行的是摄影原则里面整幅图像要简介的原则,即一张图像本文想要突出图像的主体,就要使背景尽可能的简洁,不要对主体的展现造成干扰,这一点其实也可以从图像的高频特征中看出来。下面本文引用Ke等人[42]中的图更好的说明这一点,如图2-1所示,是两幅图的边缘特征,根据边缘特征本文可以猜想到b图是一朵画,a图可能是办公室也可能是家中的一个角落,总之不太容易猜不出来图像中的内容。由此可见,b图的边缘更加完整,整个图像更简洁,a图则比较凌乱,对应的b图的质量想必高于a图。通过这个边缘就可以反应图像的简单性。当然对于前背景还有很多的属性,如曝光、饱和度、色调等对比度的方法[46-48],这些提取特征的目标都是一致的,主要目标就是提取出前背景的对比信息,只是通过的角度不同而已。图2-1两幅图像的边缘特征其次介绍颜色分布特征。这个是一个在很多图像检索中都会用到的特征,最直接的展现方式就是颜色直方图。直方图现在出现的很多,例如本文的摄像机中都会有,还有一些好一点的图像处理软件也会有颜色直方图。对于高质量的图像,都会有一个整体统一的风格,或是偏重冷色调,或是偏重暖色调,这些本文都可以直接通过色彩直方图看出来。与此同时,局部直方图的复杂程度也可以反应出
第二章图像美学描述相关技术11一幅图像的风格一致性。色调也是用来区分图像好坏的重要特征。一张好的静物摄影图,色调一般会比较单一如图2-2所示三张图像,通过单调干净的色调带给人简单、舒适的感觉。Lou等人[22]在Ke等人[42]的基础上对图像特征提取进行了补充,添加了另外两个新的原理,即90配测方案和互补色方案。这两个方案是设计学中的经典配色方案。在色调论中本文可以看出,具有视觉上美感的主色调搭配方案,常常是区间相隔90度或者180度左右的。Lou等人[22]提出了具体的计算这个色调特征的方法:具体计hue的复杂度,就是要求把图像转换到HSV空间中,从而通过计算得到H通道。然后将其等分成多个bins,再设定阈值来计算色调的种类。图2-2色调简单的图像对比度和明亮度也是传统特征提取中经常提取的特征,并且这两个特征总是一起研究。在亮度中,摄影专家总是会提到“50度灰”这个名词,该名词的意思是照相机会自动将一张图像调整成为50度灰,也就是自动曝光。但是对于一张具有美感的图像来说,本文往往更加喜欢主题曝光,对于背景本文希望越简单越好,因此主题和背景的对比度高的,往往图像更加具有美感。在检测图像的亮度和对比度方面,主要采用的是saliencydetecting的原理。该原理的主要方法是把显著目标当作前景,把除了显著目标以外的地方当做背景,通过这种划分后,计算出来一些前景和背景的指标,进行比较。清晰度和色彩方面,LouandTang等人[22]提出了一个当时比较新颖的方法通过暗通道特征来检测主体区域的清晰度和色彩,这本身是对暗通道特征的强加使用,不过做出的效果还是很不错的。与摄影有关的特征中,主要利用的三分法构图的原理对图像进行评判。三分法构图能够使整张图像的布局更加紧凑,视觉效果更好,
【参考文献】:
期刊论文
[1]图像美学质量评价技术发展趋势[J]. 金鑫,周彬,邹冬青,李晓东,孙红波,吴乐. 科技导报. 2018(09)
[2]图像自动标注方法研究综述[J]. 徐勇,张慧. 现代情报. 2016(03)
[3]可计算图像美学研究进展[J]. 王伟凝,蚁静缄,贺前华. 中国图象图形学报. 2012(08)
[4]基于色彩描述的图像情感语义查询[J]. 王伟凝,贺前华. 华南理工大学学报(自然科学版). 2008(01)
本文编号:3026171
【文章来源】:天津工业大学天津市
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
Wang等人[14]生成的图像美学描述
鳌⑸?鳌⒍员榷?和明亮度、清晰度和色彩等,以及一些图像通用的特征如SIFI(尺度不变特征变换匹配)、Hog(方向梯度直方图)、BOV(Bag-of-Visual-Words)等;与摄影相关的特征包括:三分法、景深、曝光度、构图、色彩、光线等等。在底层特征中本文首先来介绍主体背景对比特征,该特征主要遵行的是摄影原则里面整幅图像要简介的原则,即一张图像本文想要突出图像的主体,就要使背景尽可能的简洁,不要对主体的展现造成干扰,这一点其实也可以从图像的高频特征中看出来。下面本文引用Ke等人[42]中的图更好的说明这一点,如图2-1所示,是两幅图的边缘特征,根据边缘特征本文可以猜想到b图是一朵画,a图可能是办公室也可能是家中的一个角落,总之不太容易猜不出来图像中的内容。由此可见,b图的边缘更加完整,整个图像更简洁,a图则比较凌乱,对应的b图的质量想必高于a图。通过这个边缘就可以反应图像的简单性。当然对于前背景还有很多的属性,如曝光、饱和度、色调等对比度的方法[46-48],这些提取特征的目标都是一致的,主要目标就是提取出前背景的对比信息,只是通过的角度不同而已。图2-1两幅图像的边缘特征其次介绍颜色分布特征。这个是一个在很多图像检索中都会用到的特征,最直接的展现方式就是颜色直方图。直方图现在出现的很多,例如本文的摄像机中都会有,还有一些好一点的图像处理软件也会有颜色直方图。对于高质量的图像,都会有一个整体统一的风格,或是偏重冷色调,或是偏重暖色调,这些本文都可以直接通过色彩直方图看出来。与此同时,局部直方图的复杂程度也可以反应出
第二章图像美学描述相关技术11一幅图像的风格一致性。色调也是用来区分图像好坏的重要特征。一张好的静物摄影图,色调一般会比较单一如图2-2所示三张图像,通过单调干净的色调带给人简单、舒适的感觉。Lou等人[22]在Ke等人[42]的基础上对图像特征提取进行了补充,添加了另外两个新的原理,即90配测方案和互补色方案。这两个方案是设计学中的经典配色方案。在色调论中本文可以看出,具有视觉上美感的主色调搭配方案,常常是区间相隔90度或者180度左右的。Lou等人[22]提出了具体的计算这个色调特征的方法:具体计hue的复杂度,就是要求把图像转换到HSV空间中,从而通过计算得到H通道。然后将其等分成多个bins,再设定阈值来计算色调的种类。图2-2色调简单的图像对比度和明亮度也是传统特征提取中经常提取的特征,并且这两个特征总是一起研究。在亮度中,摄影专家总是会提到“50度灰”这个名词,该名词的意思是照相机会自动将一张图像调整成为50度灰,也就是自动曝光。但是对于一张具有美感的图像来说,本文往往更加喜欢主题曝光,对于背景本文希望越简单越好,因此主题和背景的对比度高的,往往图像更加具有美感。在检测图像的亮度和对比度方面,主要采用的是saliencydetecting的原理。该原理的主要方法是把显著目标当作前景,把除了显著目标以外的地方当做背景,通过这种划分后,计算出来一些前景和背景的指标,进行比较。清晰度和色彩方面,LouandTang等人[22]提出了一个当时比较新颖的方法通过暗通道特征来检测主体区域的清晰度和色彩,这本身是对暗通道特征的强加使用,不过做出的效果还是很不错的。与摄影有关的特征中,主要利用的三分法构图的原理对图像进行评判。三分法构图能够使整张图像的布局更加紧凑,视觉效果更好,
【参考文献】:
期刊论文
[1]图像美学质量评价技术发展趋势[J]. 金鑫,周彬,邹冬青,李晓东,孙红波,吴乐. 科技导报. 2018(09)
[2]图像自动标注方法研究综述[J]. 徐勇,张慧. 现代情报. 2016(03)
[3]可计算图像美学研究进展[J]. 王伟凝,蚁静缄,贺前华. 中国图象图形学报. 2012(08)
[4]基于色彩描述的图像情感语义查询[J]. 王伟凝,贺前华. 华南理工大学学报(自然科学版). 2008(01)
本文编号:3026171
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3026171.html
最近更新
教材专著