弱监督学习下的多标签图像分类

发布时间:2021-08-18 01:40
  自然图像往往是包含着多种物体类型的多标签图像。对多标签图像进行准确地分类,既是计算机进行高级视觉理解的基础之一,也在实际生活中有着广泛的应用。由于多标签图像中包含了多种类型的物体,且往往具有复杂的背景信息,实现其准确分类具有较大的挑战,强监督学习是一种较好的解决方案。然而,强监督学习模型需要代价昂贵的目标级或者像素级标签作为监督信息。为了降低强监督学习的成本,本文对弱监督学习条件下的多标签图像分类算法进行了研究。一方面,本文改进了当前主流的图像分类网络框架。在当前主流的图像分类网络框架下,不同类型的物体之间存在着严重的特征竞争现象。这种特征竞争使得各类别在分类过程中所能获得的特征信息量严重受到其样本数量的影响。为此,本文提出了多路网络框架,以降低这种类型间的特征竞争带来的负面影响。本文的实验证明该框架能够很好地缓解特征竞争现象,提升多标签图像分类算法的性能。此外,该网络框架还具有很好的灵活性,可以依据不同的任务,设计相应的网络结构。另一方面,受到人类视觉注意机制的启发,本文设计了基于注意机制的多标签图像分类模型。首先,本文在多标签图像分类网络中引入空间注意机制,促使网络能够更好地学习物... 

【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校

【文章页数】:72 页

【学位级别】:硕士

【部分图文】:

弱监督学习下的多标签图像分类


多路卷积神经网络框架

全连接,全局,权重,特征对


每一列都进行归一化处理,以更好地进行可视化。可视化结果如图 3.4 所示,红色表示高权重,而蓝色表示低权重。图3.4 原始 ResNet-50 中的全连接层权重从图 3.4 中我们可以看出原始 ResNet 在学习的过程中,全局平均池化输出的特征倾向于分配给某一特定类型的输出,而没有很好地实现特征的复用。接下来,我们进一步分析 ResNet 所学习到的全连接权重与各类别的样本数量的关系。由于经过卷积网络以及全局平均池化后获取的特征通过全连接层直接与各类别的预测结果相连接,通过分析全连接层学习得到的权重,即可获取各特征对最终各类别目标分类结果的影响。我们通过两种方式衡量各个特征对某一类别的影响程度,也


本文编号:3348931

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3348931.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3dd4c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com