基于无监督增量学习的跨域行人重识别
发布时间:2021-02-06 05:13
行人重识别(Person Re-ID)是一个应用范围非常广的任务,目前很多方法已经在单域上实现了非常大的性能提升。然而,将一个模型适应到一个没有标签的新域上仍然非常困难。这是因为两个域采集数据的摄像头通常是不同的,最后会导致数据的分布也会出现差异,目前这是行人重识别推向实际应用的一个主要障碍。为了解决这个问题,很多研究者尝试了不同的办法,比如学习一个从源域到目标域的不变映射或者利用生成对抗网络创造属于目标域的“假”数据等等,但是都没有取得太好的效果。为了解决这个问题,我们从一个基本事实出发,即目标域上没有标签的数据非常容易获取,并且在实际中会以增量的方式获得。基于这个考虑,我们提出了一个新奇的无监督增量学习框架,充分利用目标域上没有标签的数据来连续地实时更新目标域上的重识别模型。首先,我们逐步地合并相似的样本成为同一个人,然后推远属于不同人的不相似的样本,同时拉近相同人的相似样本来优化模型;接着,通过一个新奇的知识蒸馏的方式,我们从在线收集的数据上增量地更新重识别模型;最后,重识别模型可以实现目标域上连续的学习过程从而来逐步地实现目标域的适应。也就是说,提出的增量学习策略可以不忘记以前...
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图2.1?—个标准的分类模型的例子,输入的图片通过卷积层和分类层最后得到分类的得分
的距离差距构造损失函数,希望正样本对的距离尽可能小,负样本对的距离尽可??能大。为了得到这种类型的输出,网络最后的分类层会被去掉,直接对分类层之??前的特征计算欧氏距离,得到两张图片或者三张图片的相似度。图2.2就是一个??二元组孪生网路的例子。??Wang等人[64]设计了一个卷积神经网络集成多尺度和多个分块来同时学习??有效的图片表示和相似度度量。这个网络通过一个二元组的输入,从图片中得到??一个全尺度的,半尺度的,上半部分和中间的部分,然后网络输出二元组图片的??相似度得分。这个结构集成了4个独立的子网络,每个子网络都嵌入不同尺度,??不同位置的图片信息。第一个子网络输入的图片大小是200x?100,第二个子网??络的输入大小下采样一倍,是100x50,下面两个子网络分别输入图片的上半部??分和中间的部分。四个子网络都由两个卷积层,两个最大池化层,一个全连接层??和一个L2归一化层构成,每个子网络都能够获得不同部分的特征表达,然后分??别计算他们的相似度得分。??Zhang等人针对通用的图像检索和跨摄像头的行人重识别提出了一个新??奇的网络结构
据逐步被收集到,我们的目标是希望能够在这些数据集上训练一个行人重识别??的模型,这个模型能够从不断收集到的目标域中的数据上进行学习,来逐步适??应到目标域上。为了实现这个目标,如图3.1所示,我们提出了一个无监督的增??量学习框架,其通过在线适应的方式来泛化??模型到目标域中。首先,使用一个标准的监督特征学习方法3.3来训练一个行人??重识别的基线模型,使用的数据集是从源域到目标域的风格转换的数据集(如??图3.1(1))。训练好了一个基线模型之后,就可以用来提取更加具有辨别度的特??征进行后续的无监督学习和增量学习。接着,我们使用基线模型对新收集到的??目标域中的无标签数据集进行行人的外形特征提取,得到所有图片的初始特征。??然后,使用这些提取的初始特征,我们借助排斥的损失和吸引的损失作为监督信??息
本文编号:3020211
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图2.1?—个标准的分类模型的例子,输入的图片通过卷积层和分类层最后得到分类的得分
的距离差距构造损失函数,希望正样本对的距离尽可能小,负样本对的距离尽可??能大。为了得到这种类型的输出,网络最后的分类层会被去掉,直接对分类层之??前的特征计算欧氏距离,得到两张图片或者三张图片的相似度。图2.2就是一个??二元组孪生网路的例子。??Wang等人[64]设计了一个卷积神经网络集成多尺度和多个分块来同时学习??有效的图片表示和相似度度量。这个网络通过一个二元组的输入,从图片中得到??一个全尺度的,半尺度的,上半部分和中间的部分,然后网络输出二元组图片的??相似度得分。这个结构集成了4个独立的子网络,每个子网络都嵌入不同尺度,??不同位置的图片信息。第一个子网络输入的图片大小是200x?100,第二个子网??络的输入大小下采样一倍,是100x50,下面两个子网络分别输入图片的上半部??分和中间的部分。四个子网络都由两个卷积层,两个最大池化层,一个全连接层??和一个L2归一化层构成,每个子网络都能够获得不同部分的特征表达,然后分??别计算他们的相似度得分。??Zhang等人针对通用的图像检索和跨摄像头的行人重识别提出了一个新??奇的网络结构
据逐步被收集到,我们的目标是希望能够在这些数据集上训练一个行人重识别??的模型,这个模型能够从不断收集到的目标域中的数据上进行学习,来逐步适??应到目标域上。为了实现这个目标,如图3.1所示,我们提出了一个无监督的增??量学习框架,其通过在线适应的方式来泛化??模型到目标域中。首先,使用一个标准的监督特征学习方法3.3来训练一个行人??重识别的基线模型,使用的数据集是从源域到目标域的风格转换的数据集(如??图3.1(1))。训练好了一个基线模型之后,就可以用来提取更加具有辨别度的特??征进行后续的无监督学习和增量学习。接着,我们使用基线模型对新收集到的??目标域中的无标签数据集进行行人的外形特征提取,得到所有图片的初始特征。??然后,使用这些提取的初始特征,我们借助排斥的损失和吸引的损失作为监督信??息
本文编号:3020211
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3020211.html
最近更新
教材专著