弱标注环境下基于多标签深度学习的加速图像标注
本文关键词:弱标注环境下基于多标签深度学习的加速图像标注
【摘要】:随着数字信息技术不断融入人们生活,各种图像的数量增长迅猛,如何对这些海量的图像进行有效的管理并从中挖掘出对用户有用的信息成为亟需解决的问题。图像的多标签语义标注用自然语言来描述图像,将对图像的检索转换为人类易于理解的文本检索,是解决以上问题的有效办法。因此,图像的多标签语义标注越来越受到重视。当前多标签图像标注主要遇到两个问题。一个来源于算法层面:基于传统机器学习的算法特征提取十分复杂,需要有经验的人进行精心的特征选取;而基于多标签深度学习的图像标注虽然效果好且不需要人工进行特征提取和挑选,但是当前的深度学习模型往往由于计算量巨大导致CPU模式下标注速度过慢而实用性较差;一个来源于数据层面:真实环境中训练数据集广泛存在语义标签集不完整问题,而且低频语义标签和高频语义标签的图像数据分布十分不均衡,这种数据集称为弱标注数据集,这种数据集的标签不完整和语义分布失衡会严重的影响模型的学习效果。针对上述问题,本文提出了弱标注环境下基于多标签深度学习的图像加速标注方法。论文的主要工作如下:(1)针对深度卷积神经网络VGG-16速度过慢的问题,构建了一种新的深度卷积神经网络:通过修改模型卷积核的步长等方法,减小每层的输出维度,构建出一个参数计算量约为网络VGG-16近1/7的深度卷积神经网络New_Net;然后再对本文提出的网络的相应卷积层进行奇异值分解(SVD),并构建出参数计算量约为网络VGG-16近1/10的分解网络New_SVD_Net。本文提出的分解网络在测试集上的平均准确率相比于网络VGG-16降低2.5%,但是在CPU模式下处理单张图片的速度却加快了近6倍,大大提升了深度模型的实用性。(2)针对弱标注数据集环境的训练数据集,设计了针对弱标注数据集的数据迭代优化算法框架:通过补充低频语义标签的单标签图像数据的方法来提升深度卷积神经网络对低频语义标签的识别精度;通过得到的最终模型对原始训练集进行预测标注,并与原始标签集进行合并,其中预测标注步骤本文使用特征融合和KNN分类器替代softmax分类器进行了优化。经实验证明,在相关数据集上,迭代优化后的训练数据集标签个数相比原始标签集增加近7%,经网络VGG-16和New Net进行学习至收敛后,在同样测试集上的平均准确率提升约1.2%。论文工作已应用于腾讯优图开放平台图像识别等商业图像识别服务,获得良好的效果。
【关键词】:弱标注 图像标注 多标签深度学习 数据迭代
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 致谢5-6
- 摘要6-7
- ABSTRACT7-10
- 1 绪论10-17
- 1.1 研究背景与选题意义10-12
- 1.2 图像标注研究现状12-14
- 1.2.1 图像标注方法类别12-13
- 1.2.2 图像标注关键问题13-14
- 1.3 深度学习的研究现状14-15
- 1.4 本文主要工作及结构安排15-17
- 2 图像标注和深度学习相关知识17-38
- 2.1 多标签图像标注框架17-24
- 2.1.1 图像特征提取18-20
- 2.1.2 多标签分类算法20-22
- 2.1.3 弱标注环境下的图像标注22-24
- 2.2 深度学习的基本概念24-26
- 2.2.1 浅层学习和深度学习25-26
- 2.3 深度学习模型26-31
- 2.3.1 卷积神经网络(CNN)26-29
- 2.3.2 深度卷积神经网络VGG-1629-31
- 2.4 基于多标签深度学习的图像标注31-35
- 2.4.1 基于多标签学习的损失函数32-33
- 2.4.2 深度模型的训练33-35
- 2.5 图像标注的评价标准35-37
- 2.6 本章小节37-38
- 3 弱标注环境下基于多标签深度学习的加速图像标注38-57
- 3.1 深度模型的加速方法38-48
- 3.1.1 主要思路38-40
- 3.1.2 加速深度卷积神经网络的设计40-43
- 3.1.3 加速网络卷积层的SVD分解43-48
- 3.2 结合深度学习的弱标注数据的迭代优化48-56
- 3.2.1 基本思路48-50
- 3.2.2 算法框架模型50-52
- 3.2.3 特征融合和分类器优化52-56
- 3.3 本章小节56-57
- 4 实验验证57-66
- 4.1 实验环境的搭建57-59
- 4.2 加速模型实验59-62
- 4.2.1 实验数据59-60
- 4.2.2 实验设计60-61
- 4.2.3 实验结果以及分析61-62
- 4.3 迭代优化实验62-66
- 4.3.1 实验数据62-63
- 4.3.2 实验设计63-64
- 4.3.3 实验结果以及分析64-66
- 5 总结与展望66-68
- 5.1 总结66-67
- 5.2 未来工作展望67-68
- 参考文献68-71
- 作者简历及攻读硕士/博士学位期间取得的研究成果71-73
- 学位论文数据集73
【相似文献】
中国期刊全文数据库 前10条
1 林茜卡;傅秀芬;滕少华;李云;;协同标签系统的应用研究[J];暨南大学学报(自然科学与医学版);2009年01期
2 吴超;周波;;基于复杂网络的社会化标签分析[J];浙江大学学报(工学版);2010年11期
3 吴金成;曹娇;赵文栋;张磊;;标签集中式发布订阅机制性能分析[J];指挥控制与仿真;2010年06期
4 李晓燕;陈刚;寿黎但;董金祥;;一种面向协作标签系统的图片检索聚类方法[J];中国图象图形学报;2010年11期
5 袁柳;张龙波;;基于概率主题模型的标签预测[J];计算机科学;2011年07期
6 张斌;张引;高克宁;郭朋伟;孙达明;;融合关系与内容分析的社会标签推荐[J];软件学报;2012年03期
7 王永刚;严寒冰;许俊峰;胡建斌;陈钟;;垃圾标签的抵御方法研究[J];计算机研究与发展;2013年10期
8 汪祥;贾焰;周斌;陈儒华;韩毅;;基于交互关系的微博用户标签预测[J];计算机工程与科学;2013年10期
9 顾亦然;陈敏;;一种三部图网络中标签时间加权的推荐方法[J];计算机科学;2012年08期
10 赵亚楠;董晶;董佳梁;;基于社会化标注的博客标签推荐方法[J];计算机工程与设计;2012年12期
中国重要会议论文全文数据库 前6条
1 朱广飞;董超;王衡;汪国平;;照片标签的智能化管理[A];第四届和谐人机环境联合学术会议论文集[C];2008年
2 房冠南;袁彩霞;王小捷;李江;宋占江;;面向对话语料的标签推荐[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 梅放;林鸿飞;;基于社会化标签的移动音乐检索[A];第五届全国信息检索学术会议论文集[C];2009年
4 李静;林鸿飞;;基于用户情感标签的音乐检索算法[A];第六届全国信息检索学术会议论文集[C];2010年
5 骆雄武;万小军;杨建武;吴於茜;;基于后缀树的Web检索结果聚类标签生成方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 王波;唐常杰;段磊;尹佳;左R,
本文编号:1018833
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1018833.html