面向多标记图片分类的新类别标记发现问题的研究

发布时间:2021-07-28 00:51
  多标记学习是机器学习领域中一种重要的学习范式,在过去几年的发展中,多标记学习算法被广泛应用到诸多多标记对象的学习场景中。随着多标记学习领域的不断发展,在标准多标记学习任务中算法的性能日益成熟,同时,机器学习算法对动态开放环境的适应性对机器学习领域的发展提出了新的挑战。传统多标记学习算法假设标记空间在训练阶段与预测阶段一致,而现实世界动态开放的环境可能会打破这一假设,因此对动态开放环境中的多标记学习进行研究,针对出现未见的新类别标记的情形提出适应性算法十分有必要。多标记图片是一类重要的多标记学习对象,多标记图片分类任务是目前具有挑战性的研究课题,其在互联网领域和安防监控场景的视频任务中应用前景广阔。同时近些年来卷积神经网络(CNN)技术的发展极大的促进了图片识别领域的发展,并且基于大规模训练集预训练的模型能够迁移到其他相关的学习任务中。因此结合卷积神经网络技术对多标记图片分类任务中可能遇到的新类别标记学习问题展开研究具有重要的理论价值和应用价值。本文将围绕动态开放环境下的多标记图片分类任务,设计算法解决新类别标记出现的问题。本文提出新类别标记学习算法MULNLC:(1)首先使用经过预训练... 

【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

面向多标记图片分类的新类别标记发现问题的研究


多标记对象示例

训练集,测试集,示例,空间


东南大学硕士学位论文2或将其预测为相近的cat标记。这种在预测阶段和训练阶段标记空间不一致的问题属于增量学习[49]中的类别增量学习,类别增量学习所解决的问题是在学习系统训练好之后,后续出现的示例带有未见的新类别。这方面的代表性工作包括LACU框架[20]和MUENL算法[21],前者是针对单示例单标记学习场景提出的算法,后者是多标记学习场景下基于异常值检测的思路提出的(其基于集成树的异常值检测算法不适合高维的图片数据),它们均不适合多标记图片分类任务下的新类别标记学习问题。多标记图片分类任务是目前具有挑战性的研究课题,其在互联网领域和安防监控场景的视频任务中应用前景广阔,因此对多标记图片分类任务中可能遇到的新类别标记学习问题展开研究具有重要的理论价值和应用价值。本文将围绕动态开放环境下的多标记图片分类任务,设计算法解决新类别标记出现的问题。本文提出的MULNLC算法首先使用经过预训练和微调的卷积神经网络模型作为多标记图片的特征提取器,基于初始训练集学习分类模型以及新类别标记检测模型;然后在可能包含新类别标记的批数据中,使用双阶段检测模块在未知标记的批数据中检测包含新类别标记的数据示例,并对于检测到的新类别标记数据使用卷积网络模型加以扩充,丰富后续学习模型的训练样本;最后,基于新类别标记数据和已知标记数据更新分类模型和新类别标记检测模型。在常用的多标记图片数据集上的实验结果表明了算法的有效性,同时,本文基于提出的MULNLC算法开发了适用于实际应用场景的“新类别标记图片标注系统”。图1-2训练集和测试集标记空间不一致性的示例

示意图,示例,示意图,类别


啾穑?3?此之外,Zhu[20]等提出一种在多标记学习场景下的新类别标记发现问题的解决框架,它假设新类别标记在时间上以一定的顺序出现,即在相同一段时间若有新类别标记出现,则假定是同一类新类别标记,然后在下一时间段中,出现的是另一类相同的新类别标记。论文引入异常值检测思路来判别一个示例是否带有新类别标记;如果带有新类别标记,则将这个示例放到缓存中,等到新类别标记在缓存中拥有足够的数据量,利用缓存中的新类别标记的示例构建该标记的分类器,更新已知标记的分类器。此外,在多标记多示例分类任务中(参见图1-3),数据以“包”的形式组织,每一个“包”中含有多个单示例,这些单示例各自带有的标记构成了“包”的标记。多标记多示例学习的目的就是在上述的数据对象上,学习从输入到输出的映射。该类问题和多标记学习以及单示例单标记学习的差异性在于“包”层次上具有多个标记,“包”内部的示例具有各自的单标记。基于相同标记的示例在特征空间中的距离更近且每个标记有原型簇中心的假设,Zhu[22]提出一种迭代优化的模型解决此类任务中新类别标记发现的问题。对以往的新类别标记学习相关方法进行总结和学习,能够对目前该问题的基本解决思路的初步把握,并且前期的工作也是后续该领域进一步发展的重要推动因素。图1-3多示例多标记学习示意图[59]


本文编号:3306866

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3306866.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dc4be***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com