当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于视觉感知和数据紧凑表达的图像美感质量评估方法

发布时间:2020-08-06 21:27
【摘要】:美是人类感知、认知和情感相互作用的结果。在计算机领域,图像美学质量评估的目的是让计算机能够模拟人类的审美系统,自动对图像的美感进行判别。研究人员通常将其转化为一个机器学习问题,即让模型在人类标注的数据上进行训练,学习如何预测图像的美学等级。而学习到的模型能在很多劳动力密集的主观任务中发挥作用,如智能照片编辑、图像推荐或搜索、海报横幅生成,其应用前景十分广泛。目前,基于大规模数据训练的深度卷积模型在可计算美学评估中被广泛使用,但是仍然存在两个难题:包括如何处理CNN的识别机制与人类审美感知识别机制之间的差异性,以及如何从大量数据中学习到更好的美学规则。本文主要通过研究将人类视觉感知和数据紧凑表达的知识应用于基于深度卷积网络的美学质量评估任务,以提升美学评估模型的性能,主要工作如下:1)提出了一种基于视觉感知的双层神经网络(Visual Perception Network),用于启发性地学习图像中与视觉感知相关的特征。该网络包含两个子网络,感兴趣区域子网络和多尺度信息子网络,分别用于学习图像中的感兴趣区域特征和多层次细粒度特征。另外,为了学习到图像中的感兴趣区域,我们还提出一种新颖的感兴趣区域搜索算法,用于搜索出图像中吸引力强的局部区域。实验结果表明,该算法能够有效地融合图像中不同层次的信息,获得较好的效果。2)设计了一种基于数据紧凑表达的训练策略。该策略关注于美学数据的有效利用问题,分阶段利用聚合程度不同的图像,学习简单到复杂的美学规则。该策略先计算数据集中图像的局部密度和距离,将数据集分为三个聚合程度不同的子集,紧凑的、稀疏的、高度稀疏的。接着从紧凑的数据开始训练,逐步加入稀疏的数据,以一种从紧凑到稀疏(Compact-to-Sparse)的方式逐步训练。实验结果表明,这种学习方式不仅能够有效地提高模型的泛化性能,而且可以学习到数据集中样本的聚合程度。本文设计的算法是在深度卷积神经网络的基础上,结合人类视觉感知的知识,从网络结构、训练数据、训练策略三方面对CNN进行改进。实验结果表明,在大规模美学数据集AVA上,我们的算法能达到较为领先的水平。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41
【图文】:

美学,美学特征,机器学习算法,模型性能


可计算美学评估的整体框架如图所示,该框架包含四个基本要素,分别是输入处理、美学特征提取、决策判别和输出量化美学等级或美学分数。美学质量评估从一般机器学习算法流程,分为训练和推理两个阶段,是一种基于学习的算法。为了得到性能优越的美学模型,美学特征设计是其中最关键的环节,无论在手阶段还是通用特征阶段,抽象的接近人类感知的高级特征的表现,都优于底层的觉特征。另外,美学问题虽然有其特殊性,但是美学模型的获取仍然是建立机器法基础上的,因而也会面临机器学习算法的一些常见问题,如过拟合和优化困难决这些问题也能够获得模型性能的提升。

美感,色彩平衡,图片,不显著


像美学分数的相对客观性。 内容多样性丰富:数据集中图片包括各类动植物、自然景观、人文景观和数字图像。图2-2中展示了 AVA 数据集中的部分图片。(a) (b)图 2-2 图 (a) 低美感图像颜色混乱,构图不规整,主体不显著,图 (b) 高美感图片通常遵循色彩平衡、高景深、主体突出。图 123 行:颜色、构图、主体。2.2.3 评估指标如 1.2 节中所述,不同的文献中使用不同的美学量化指标来评价模型的性能,这主要取决于算法的应用场景,常用的评估指标有以下几个:(1) 分类准确度指标[1,15,16,26,27](2)回归精度指标[26

卷积,特征提取,张量,特征提取器


涉及到误差的反向传播算法。在反向传播时,网络中的每一层都接受后一层返回的梯度张量输入,并通过计算产生本层的梯度张量输出,直至输入层。在训练结束后,网络中的参数已经固定了,可以得到一个可用于美学量化评估的模型。图2-3展示了一个完整的 CNN 结构。图 2-3 一个典型的 CNN 结构。该结构前半部分为特征提取器,后半部分为分类器,网络的输出结果为预测输入图像属于的各类别概率。2.3.2 CNN 的特征提取单元CNN 的特征提取工作主要是依靠卷积层、池化层和激活层共同完成的。其中卷积层是 CNN 中的核心组件,大部分的计算量来源于卷积层,在 CNN 中担任着特征提取14

【相似文献】

相关期刊论文 前10条

1 贾丽娟;;关于图像分辨率的教学思考[J];印刷世界;2011年05期

2 丁晓莲;周激流;李晓华;吴朋;;人脸识别率与图像分辨率关系的比较分析[J];计算机工程;2009年11期

3 张秀屏,刘锡国,丛玉良;提高彩电图像分辨率的研讨[J];光学精密工程;1994年02期

4 卫红;为DVD机配哪种彩电[J];家庭科技;2000年07期

5 卜丽静;张铭娟;陈方惠;许峥辉;赵晓宇;;利用地面靶标的超分辨率重建图像分辨率评价[J];测绘科学;2019年12期

6 ;斯波特5卫星商业图像分辨率将达2.5m[J];国际太空;1997年05期

7 宋其华;郭根生;;解析计算机图像分辨率[J];中国电化教育;2003年11期

8 谷梗;;数字图像分辨率定义与其计量方法——对“数字电影技术术语普及读本”有关条目的商榷意见[J];现代电影技术;2013年07期

9 ;教你详细了解各种分辨率[J];计算机与网络;2011年24期

10 谢美华;王正明;;图像分辨率增强的偏微分方程方法[J];遥感学报;2005年06期

相关会议论文 前10条

1 杨德强;苏光大;徐天伟;;一种基于幻想脸的人脸图像分辨率提升新技术[A];第二十七届中国控制会议论文集[C];2008年

2 翟广涛;;基于二进小波变换的图像分辨率增强算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年

3 任晓晖;龚勇清;;体全息存储再现图像分辨率实验研究[A];第十一届全国光学测试学术讨论会论文(摘要集)[C];2006年

4 陈乐;强天鹏;章有为;;小径管CR射线检测图像分辨率研究[A];2017远东无损检测新技术论坛论文集[C];2017年

5 赵源萌;邓朝;张馨;张存林;;被动式人体太赫兹安检成像的分辨率增强算法研究[A];中国光学学会2011年学术大会摘要集[C];2011年

6 张月婷;仇晓兰;丁赤飚;雷斌;付琨;;高分辨率SAR图像桥梁目标仿真与特性分析[A];第三届高分辨率对地观测学术年会(地面系统与应用技术分会)优秀论文集[C];2014年

7 张龙;张翔;孟新秀;;基于图像的舰船目标识别技术研究[A];2019年全国公共安全通信学术研讨会优秀论文集[C];2019年

8 郑虹;曾坤;郭迪;应佳熙;杨钰;彭玺;陈忠;屈小波;;基于梯度引导的边缘增强多对比度脑部MRI图像超分辨[A];2018第二十届全国波谱学学术年会会议论文摘要集[C];2018年

9 吴明晓;张晶;;基于深度学习的颈动脉超声图像斑块识别方法[A];中国医学装备大会暨2019医学装备展览会论文汇编[C];2019年

10 蔡世学;;最新研制的一种小型空载图象雷达成果[A];第十三届全国遥感技术学术交流会论文摘要集[C];2001年

相关重要报纸文章 前10条

1 记者 刘霞;迄今最详细人脑图像“出炉”[N];科技日报;2019年

2 记者 刘海英;商用打印机印制出隐形图像[N];科技日报;2016年

3 尹长城 北京大学医学部生物物理学系教授 分析中心电镜室主任 中国生物物理学会冷冻电镜分会副理事长 中国电子显微学会低温电镜专业委员会主任;获诺奖的冷冻电镜是何方“神器”?[N];北京科技报;2017年

4 刘筱霞;陈永常;PHOTOSHOP中图像分辨率的设置[N];中国包装报;2002年

5 WLF;细说分辨率[N];电脑报;2003年

6 记者 曾遗荣邋通讯员 冷承秋 实习生 向哲林;美国一高科技公司将落户武汉[N];湖北日报;2007年

7 金凤;无需眼镜就能看 能听还能“摸”的3D影像来了[N];科技日报;2019年

8 燕兰;先科电子:为品牌DVD正名[N];中国经营报;2000年

9 宋连党;家庭VCD像册大制作[N];中国电脑教育报;2003年

10 ;第四代超级CCD的实力[N];计算机世界;2004年

相关博士学位论文 前10条

1 樊春玲;数据驱动的图像感知和质量评价方法[D];中国科学院大学(中国科学院深圳先进技术研究院);2019年

2 卞春江;光学遥感图像有效区域在轨实时检测与压缩技术研究[D];哈尔滨工业大学;2018年

3 牛仁杰;星载ATP图像处理平台关键技术研究[D];中国科学院大学(中国科学院光电技术研究所);2018年

4 穆楠;夜间场景下显著目标检测方法研究[D];武汉科技大学;2019年

5 张士杰;超像素级图像组协同关联性分析与研究[D];天津大学;2017年

6 王文胜;宽幅光学遥感图像舰船飞机目标检测识别技术研究[D];中国科学院大学(中国科学院长春光学精密机械与物理研究所);2018年

7 孙琨;图像匹配与场景三维重建方法研究[D];华中科技大学;2017年

8 霍丽娜;基于视觉感知与注意机制的图像显著目标检测[D];西安电子科技大学;2016年

9 王体春;基于保真性准则的图像智能增强和图像质量评价的理论和方法[D];重庆医科大学;2018年

10 汤杨;基于图像绘制的Image Warping理论与方法研究[D];南京理工大学;2006年

相关硕士学位论文 前10条

1 秦靖翔;星载SAR图像舰船检测算法研究[D];电子科技大学;2019年

2 韦永来;基于摄像机网络拓扑结构的行人再识别研究[D];合肥工业大学;2019年

3 张明蕊;SAR图像数据分集与扩容方法研究[D];电子科技大学;2019年

4 辛佳佳;基于DSP的同时偏振图像去雾系统设计[D];长春理工大学;2019年

5 闫峰;基于优化极限学习机算法对焊点的质量识别[D];云南大学;2018年

6 林思哲;基于自底向上的视觉显著性检测模型研究[D];电子科技大学;2019年

7 张大伟;基于GAN的人脸图像补全算法研究[D];长安大学;2019年

8 唐义Z

本文编号:2782988


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2782988.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dc20c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com