当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的多标签图像分类方法研究

发布时间:2022-01-14 06:29
  随着互联网技术的飞速发展,图像信息在爆发式增长的各类数据信息资源中占据着重大的比例。面对海量的数据,人们如何整理、分析、获取到自己需要的信息就变得格外重要。在现实生活中,图像信息大多包含丰富的语义信息,如多个目标,场景,行为等。因此,多标签图像分类方法的研究有着更为实际的意义。深度学习的发展将人们对计算机视觉领域的研究带入了一个新纪元,卷积神经网络作为深度学习中的典型模型被成功的大量用于计算机视觉的各个领域。本文针对多标签图像分类问题,基于深度学习理论,详细分析和深入研究多种多标签图像分类模型,并提出了基于深度学习模型的多标签图像分类方法。全文主要研究内容如下:1.介绍了多标签图像分类方法和深度学习的研究背景及意义和研究现状。针对多标签图像分类研究课题进行了深入的研究分析,包括传统的多标签图像分类方法和基于深度学习的多标签图像分类方法的基本理论。同时,详细介绍了多标签图像分类方法的基本架构和思路,并对典型的分类模型进行了详细的分析。2.针对多标签图像分类方法中捕获语义关联信息的难点,提出一种基于卷积神经网络并融合注意力机制和语义关联性的多标签图像分类方法。首先,利用卷积神经网络来提取特... 

【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

基于深度学习的多标签图像分类方法研究


一个三层金字塔模型举例Fig2.3Anexampleofathree-layerpyramidmodel

模型框架,网络模型,卷积


NeocognitronHuel&WieselLeCun1989LeNetAlexNetDropoutReLUFast R-CNNSPP-NetR-CNNInception V3Inception V4NINGoogleNetVGG16VGG19MSRANetFaster R-CNN早期尝试ResNet Densenet网络加深增强卷积模块功能从分类任务到检测任务两条路线的集成,训练更深的网络结构,加速收敛历史突破图 2. 4 卷积神经网络发展趋势Fig 2. 4 The development trend of convolutional neural networks虽然不同卷积网络模型之间存在着一定的差异性,但 ALexNet 网络模型的框架是大多网络模型的基础,因此,如图 2.5 所示,以 ALexNet 模型为例,介绍卷积神经网络的主要结构。

线性可分,二维空间,中数,损失函数


损失函数L(Y, f(x))评价预测函数f(x)的准确程度损失函数越小,模型越好图 2. 8 损失函数定义Fig 2. 8 Definition of the loss function类型有很多,图像分类中基于支持向量机的二元支持向量机[40,41](SVM)一种二分类器,其关键样本之间间隔最大的超平面,通常采用间隔最大。线性支持向量机是支持向量机的一种,线性的分,如图 2.9 所示,可以直接通过一个超平面直接


本文编号:3587994

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3587994.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fd587***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com