基于深度学习的细粒度图像分类方法研究

发布时间:2025-02-11 19:06
  细粒度图像分类是指在区分出基本类别的基础上,进行更详细的子类划分,如区分鸟的种类、车的款式、飞机的型号等。细粒度图像分类在现实中具有较高的研究价值和深远的应用前景,因而成为计算机视觉领域的研究热点。然而,现阶段的细粒度图像分类研究依然面临一些挑战。比如:子类别之间的差异往往非常微妙,导致类别间的鉴别性区域难以被准确定位;物体的姿态变化与视觉变化,导致对图像中有效特征的提取工作较难开展。针对这两个问题,本文基于深度学习,构建了一个细粒度图像分类模型,该模型包括基于无监督学习的鉴别性区域定位方法、基于循环注意力的细粒度特征提取方法。模型有效解决了鉴别性区域难以定位和图像有效特征难以提取的问题。模型在CUB-200-2011、FGVC-Aircraft以及Stanford Cars数据集上进行了实验,实验结果表明,该模型与现有先进方法相比具有明显优势。本文的主要贡献如下:(1)提出了一种基于无监督学习的鉴别性区域定位方法(Discriminant Region Location Method Based on Unsupervised Learning,DRLU)。首先,方法中的区域检测器利用...

【文章页数】:75 页

【学位级别】:硕士

【部分图文】:

图2 人脸细粒度图像分类识别结果

图2 人脸细粒度图像分类识别结果

为了验证所研究方法的分类识别的效果,随机选取上文数据库中的三幅不同人脸、不同表情的人脸图像。将所研究方法与文献[3](基于深度迁移学习的微型细粒度图像分类)和文献[4](基于文本与视觉信息的细粒度图像分类)进行对比仿真,测试三种方法的分类如图2所示。由图2可知,文献[3]方法的分....


图1.1总体技术方案

图1.1总体技术方案

基于深度学习的细粒度图像分类方法研究6使用多尺度特征采样方法对特征区域进行采样,在兼顾岩石样本整体特征信息的同时,挖掘样本多种尺度细节信息;最后,使用超图的特征融合方法统筹样本的整体和细节特征信息。该识别方法为大规模的岩石图像标注和识别提供了一种新方法,有效提高了细粒度岩石图像的....


图2.1ResNet构建单元(Heetal.,2016)

图2.1ResNet构建单元(Heetal.,2016)

判愕奶卣魈崛∧芰Γ??绮闶?蕉啾泶锬芰υ角浚?深层网络提取的特征更抽象,更具有语义信息。但随着网络深度的增加,模型的精度会逐渐增加到饱和并迅速下降,这就是深层网络的“退化(degradation)”问题。虽然许多深度网络采取了ReLU激活函数、批量归一化(BN)等操作缓解梯度消失....


图2.2RetinaNet基础结构(Linetal.,2017b)

图2.2RetinaNet基础结构(Linetal.,2017b)

由于受制于类别失衡(classimbalance),算法的检测精度偏低。为了解决类别失衡这一问题,Lin等人(2017b)提出使用focalloss替代交叉熵损失,通过调整损失函数的计算公式使一阶段目标检测算法达到和FasterR-CNN同样的准确度。focalloss的计算方式....



本文编号:4033722

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4033722.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c73d5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com