基于对抗自编码网络的开集识别研究
发布时间:2021-03-20 21:16
图像识别是计算机视觉领域一个典型的任务。相对于闭集假设下的图像识别任务,开集识别不仅能够识别训练数据集中的已知类别,而且能够对训练数据集中没有出现的未知类别对象,做出拒绝响应或标注为“未知”。在真实世界的识别或分类任务中,对识别器或分类器进行训练时,由于受到各种客观因素的限制,通常很难收集到穷尽所有类别的训练样本。更普遍的情况是开集识别(Open Set Recognition,OSR),训练时存在对世界的不完备类别知识,测试时允许将未知的类别实例提交给算法。要求分类器不仅准确对训练数据集中已有的类别进行分类,而且还要有效地处理那些在训练数据集中没有出现的类别。近年来随着深度学习的兴起,针对图像识别的深度学习在很大程度上依赖于卷积神经网络模型。虽然卷积神经网络(Convolutional Neural Networks,CNNs)识别模型很有效,但是良好的效果很少能被理论解释。最近解决开集识别任务的方法包括两个主要部分:在属于同一类别的对象上引入距离度量,使其具有较低的类内距离;然后建立了一个紧凑的衰减概率模型。对于某一测试对象实例,当概率低于已知类的阈值时,就确定该对象属于训练数据集...
【文章来源】:中原工学院河南省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
传统的识别和开集识别的比较
中原工学院硕士学位论文4图1.2训练数据的样例分布及生成概率的示意图[8]在一个共同的闭集或静态环境的假设下,训练和测试数据来自相同的分布。传统的识别和分类算法已经在各种闭集假设环境下的机器学习任务中取得了显著的效果。然而,更现实的场景通常是开放的、非静态的,如无人驾驶、工业故障检测、医疗诊断等。在这些场景中,可能会出现未知的意外情况,这大大削弱了这些现有方法的鲁棒性。为迎接这一挑战,近几年研究人员实际探索了终身学习(LifelongLearning)[9]、转移学习(TransferLearning)[10]、领域适应(DomainAdaption)[11]、零样本(Zero-shotLearning,ZSL)[12]、单样本(少样本)学习识别(One-shotLearning&Few-shotLearning)[13]、开集识别(OpenSetRecognition,OSR)等相关研究领域。开集识别的研究进展对机器人视觉系统、工异常检测、新药物的发现、开集人脸识别等领域有着重大的应用意义和实际经济效益。1.2研究现状2013年,Scheirer[14]等首次将开集识别问题形式化,提出了一种1-vs-Set机器的初步解决方案。模型中包含一个开集风险项,考虑超出训练数据集中已知类别合理支持的范围空间。具体来说,他们在特征空间中加入了一个与支持向量机得到的分离超平面平行的超平面,在特征空间中形成了一个夹板。进一步,定义线性核平板模型的开集风险。在这种情况下,出现在两个超平面之间的测试样本将被标记为适当的类。其他的测试样本将被视为非目标类或被拒绝。从那时起,开集识别就引
中原工学院硕士学位论文13征向量距离流形面的距离小于阈值时,可以认为测试图像是一个正常的数据。图1.3对训练数据集标签的不同处理的模型对比当然,也可以如图1.4右图所示设置一个距离拒绝域。图像测试样例生成的图像特征向量距离流形面的距离大于距离拒绝域的上界,才会被认为是异常数据。当测试图像生成的图像特征向量距离流形面的距离落在距离拒绝域中,可以让人工决策是否为异常类别。同样地,在概率生成模型中,可以设置一个概率阈值或概率拒绝域。在图1.3中的第三行子图中,将图像数据标签和图像数据融合,通过神经网络学习到数据特征的流形分布,这样会学习到更有区分性的图像特征。使得内类图像特征更紧凑,类间图像特征更分散。从而达到更好的开集识别效果。图1.4二分类的阈值判别和拒绝域判别由于训练图像数据标签的引入。在训练开集图像识别的过程中,考虑到训练数据标签信息,所以损失函数也需要考虑标签信息。
本文编号:3091681
【文章来源】:中原工学院河南省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
传统的识别和开集识别的比较
中原工学院硕士学位论文4图1.2训练数据的样例分布及生成概率的示意图[8]在一个共同的闭集或静态环境的假设下,训练和测试数据来自相同的分布。传统的识别和分类算法已经在各种闭集假设环境下的机器学习任务中取得了显著的效果。然而,更现实的场景通常是开放的、非静态的,如无人驾驶、工业故障检测、医疗诊断等。在这些场景中,可能会出现未知的意外情况,这大大削弱了这些现有方法的鲁棒性。为迎接这一挑战,近几年研究人员实际探索了终身学习(LifelongLearning)[9]、转移学习(TransferLearning)[10]、领域适应(DomainAdaption)[11]、零样本(Zero-shotLearning,ZSL)[12]、单样本(少样本)学习识别(One-shotLearning&Few-shotLearning)[13]、开集识别(OpenSetRecognition,OSR)等相关研究领域。开集识别的研究进展对机器人视觉系统、工异常检测、新药物的发现、开集人脸识别等领域有着重大的应用意义和实际经济效益。1.2研究现状2013年,Scheirer[14]等首次将开集识别问题形式化,提出了一种1-vs-Set机器的初步解决方案。模型中包含一个开集风险项,考虑超出训练数据集中已知类别合理支持的范围空间。具体来说,他们在特征空间中加入了一个与支持向量机得到的分离超平面平行的超平面,在特征空间中形成了一个夹板。进一步,定义线性核平板模型的开集风险。在这种情况下,出现在两个超平面之间的测试样本将被标记为适当的类。其他的测试样本将被视为非目标类或被拒绝。从那时起,开集识别就引
中原工学院硕士学位论文13征向量距离流形面的距离小于阈值时,可以认为测试图像是一个正常的数据。图1.3对训练数据集标签的不同处理的模型对比当然,也可以如图1.4右图所示设置一个距离拒绝域。图像测试样例生成的图像特征向量距离流形面的距离大于距离拒绝域的上界,才会被认为是异常数据。当测试图像生成的图像特征向量距离流形面的距离落在距离拒绝域中,可以让人工决策是否为异常类别。同样地,在概率生成模型中,可以设置一个概率阈值或概率拒绝域。在图1.3中的第三行子图中,将图像数据标签和图像数据融合,通过神经网络学习到数据特征的流形分布,这样会学习到更有区分性的图像特征。使得内类图像特征更紧凑,类间图像特征更分散。从而达到更好的开集识别效果。图1.4二分类的阈值判别和拒绝域判别由于训练图像数据标签的引入。在训练开集图像识别的过程中,考虑到训练数据标签信息,所以损失函数也需要考虑标签信息。
本文编号:3091681
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3091681.html