基于标签相关性学习的多标签图像识别研究
发布时间:2021-08-19 20:01
多标签图像分类旨在准确的分类出图像中的不同目标所属类别,其广泛的用于场景识别、属性分类等现实场景中。该任务的核心研究问题是利用多个标签之间的相关性,根据已经分类出的类别,推测出其他可能存在但是难以识别的类别。标签之间相关性的学习一直是多标签分类领域的核心研究课题,并且研究进展缓慢,精度较差,难以直接落地于现实应用。深度学习技术的飞速发展,加快了多标签图像分类的研究进程,也提供了标签相关性学习的新思路。针对标签相关性的学习问题,本研究提出使用基于度量学习的多标签识别算法,将图像和标签映射到同一个空间,在此空间中利用度量学习的方法聚类具有联系的特征和标签,学习标签之间的联系,并设计新的Ranking Loss监督度量学习的过程。另外,在复杂情况下多标签图像分类尤其是大规模多标签图像分类任务中,以往的研究忽略了两个更现实的问题:类别分布不均衡和目标大小差异较大,这两个问题都会对最终的分类结果产生坏的影响。本研究针对上述问题,提出基于自注意力机制的算法,设计的深度神经网络在训练过程中自适应的关注对识别有用的特征,并通过构建特征注意力矩阵间接的利用标签之间的联系。为验证算法的作用,本研究在国际权...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
单标签图像识别对比多标签图像识别
华 中 科 技 大 学 硕 士 学 位 论 文的,对于生物来说,生物的神经元之间的连接是稀疏连接方式,高效的深具有类似的性质。Google 团队设计了 Inception 模块,该模块并行的使用的卷积获取图像的特征,Inception 模块如下图所示,以多支并行的结构近神经网络,在训练中,神经网络有更大选择权选择其中最有用的特征。
图 2-1 Inception 模块Inception 中使用了 1*1 的卷积核进一步的减少参数量。在 Ima别结果表明,InceptionNet 实现了超过 AlexNet 和 VGG 的识别准on 模块的提出使神经网络的设计朝着更深的方法发展,但是,网数量逐渐增加,过拟合和网络难以优化的问题日益突出。单纯增降低了图像识别精度,出现退化的问题。在这个基础上,有研究结构,其图示如下:
【参考文献】:
期刊论文
[1]一种基于示例非独立同分布的多示例多标签分类算法[J]. 陈彤彤,丁昕苗,柳婵娟,邹海林,周树森,刘影. 计算机科学. 2016(02)
[2]主动学习的多标签图像在线分类[J]. 徐美香,孙福明,李豪杰. 中国图象图形学报. 2015(02)
本文编号:3352051
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
单标签图像识别对比多标签图像识别
华 中 科 技 大 学 硕 士 学 位 论 文的,对于生物来说,生物的神经元之间的连接是稀疏连接方式,高效的深具有类似的性质。Google 团队设计了 Inception 模块,该模块并行的使用的卷积获取图像的特征,Inception 模块如下图所示,以多支并行的结构近神经网络,在训练中,神经网络有更大选择权选择其中最有用的特征。
图 2-1 Inception 模块Inception 中使用了 1*1 的卷积核进一步的减少参数量。在 Ima别结果表明,InceptionNet 实现了超过 AlexNet 和 VGG 的识别准on 模块的提出使神经网络的设计朝着更深的方法发展,但是,网数量逐渐增加,过拟合和网络难以优化的问题日益突出。单纯增降低了图像识别精度,出现退化的问题。在这个基础上,有研究结构,其图示如下:
【参考文献】:
期刊论文
[1]一种基于示例非独立同分布的多示例多标签分类算法[J]. 陈彤彤,丁昕苗,柳婵娟,邹海林,周树森,刘影. 计算机科学. 2016(02)
[2]主动学习的多标签图像在线分类[J]. 徐美香,孙福明,李豪杰. 中国图象图形学报. 2015(02)
本文编号:3352051
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3352051.html
最近更新
教材专著