基于卷积神经网络的图像标注算法研究

发布时间:2021-08-06 01:25
  在大数据时代,每天都有海量的图片上传到互联网,为了对如此大规模图像数据进行有效的管理和检索,图像的高效自动标注显得越来越重要。图像自动标注就是利用算法使得计算机能自动为图像赋上与图像语义内容相关的关键词汇,其本质是在图像的高层语义信息和底层特征之间建立一种映射关系。传统的图像标注算法需要手动提取特征,不适应大规模的数据集,而基于深度学习的图像标注算法大多忽视了图像的多标签性,且这些算法没有考虑图像标签间的关联性,以致提取的特征不够高效。基于此,本文对基于卷积神经网络的图像自动标注的理论和方法进行了深入的探究,针对现有方法存在的问题提出了改进算法和模型。本文的主要工作内容如下:(1)提出基于Sigmoid损失函数的卷积神经网络图像标注算法。针对图像标注任务的多标签性,将卷积神经网络常用的Softmax损失函数改为Sigmoid损失函数,更好地适应多标签学习,提出了一个适用于多标签图像的卷积神经网络模型;并使用256位编码特征来表示图像从而进行图像标注,获得了方便存储和图像快速比较的特征,最后通过实验验证所提出模型的有效性。(2)提出基于多标签加权三元组损失函数的卷积神经网络图像标注算法。... 

【文章来源】:苏州大学江苏省 211工程院校

【文章页数】:89 页

【学位级别】:硕士

【部分图文】:

基于卷积神经网络的图像标注算法研究


图1-1?“语义鸿沟”示例??

卷积,神经网络,图像,内容


leNet|?=输入??j?第皁:棰十Sigmoid损失函数的CNN图像标ill法?j??卜i?|?!??,一,aS?〇?V?:?;?£,?£,?4?.?.?SE??!?r^J^L卜丨了卜;??一^?;丨??lnCr"|-^:-^?j?!?’?T?—???CCA-KNN?;??|?丨!?I??I?I?I?I??*网t:坫于加权.SSlfiiX函数的OWIS?Wil_?ii?I?|?第Ti申:S十SSE特征的CNNIH悚坫itB.L).?I??!?J?!?^??图1-2本文的主要研究内容??本文主要从两个角度对基于卷积神经网络的图像自动标注算法进行改进。一??是对卷积神经网络的损失函数进行优化,二是对模型的网络结构进行改进。对于??激活函数,本文先从图像的多标签性出发,将卷积神经M络常用的Softmax函数改??为Sigmoid函数,提取全面高效的多标签图像特征,以适用于多标签图像标注的任务;??后又从标签间的联系和相似图像间的差异性出发,对损失函数进行创新,提出了基??于加权多标签三元组损失函数,该损失确数考虑丫标签间的信息,同时增加了网络??模型的内聚性,改善了图像的标注效果。对于网络结构,本文在卷积神经网络中引??入SE模块,学习到卷积层各通道信息不同的重要程度,提高卷积层输出的表征能力,??同时从特征的空间像素点出发,考虑各像素之间重要性,提出了SSE特征提取方法,??从而获得了兼顾通道和空间信息的卷积层特征。??1.5本文内容安排??本文主要探宄基f卷积神经网络的图像标注算法,章节内容及结构安排如卜:??第一章为绪论,简耍介绍/图像D动标注的研究背景和意义,并对卷积祌经网??7??

分析图,示例,图像,语义


基于卷积神经网络的图像标注算法研宄?第二章相关T:作??第二章相关工作??本章将从三个方面介绍本文的相关技术背景。首先,概述分析图像自动标注算??法的基本框架;然后,介绍卷积神经网络的工作原理;最后,回顾几种典型的图像??自动标注算法。??2.1图像自动标注的基本框架??图像自动标注利用算法使得计算机能自动为图像赋上与图像语义内容相关的关??键词汇,如图2-1所示。它是一种多标签学习问题,它通过对多标签图像数据集的训??练,学习到图像视觉特征和语义标签的关系模型,构建低层视觉特征和卨层语义的??映射关系,这种关系在一定程度上可以解决“语义鸿沟”问题。??courtyard?building?%?man?man??jd?building?columns?kitchen?woman??|?纛羞*?arches?丨lowers?Wa!,?waI1??9?columns?yard?■?^?women?caps??flowers?trees?■,、skirts?bag??trees?house?■?hats??tourists?tourists?tourists?person??癱?square?reed?creek?bridge??'?rec^?square?g?bridge?rails??^3.?house?camera?rails?trees??mountain?grass?vegetation?creek??图2-1图像标注示例??图像自动标注的基本框架如图2-2所示。主要步骤分为图像预处理、图像特征提??娶模型训练、算法优化、标签预测。??图像预处理:在图像标注中,


本文编号:3324796

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3324796.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9adbd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com