基于深度学习的标签传播的图像分类研究

发布时间:2021-03-05 21:52
  在计算机视觉领域,图像分类任务一直都是热点问题。而其中半监督图像分类任务更是获得了国内外学术界的广泛关注,仅仅利用少量有标签数据和大量无标签数据,便可通过本文提出的算法训练出一些实用的模型。在当下,深度学习对于图像处理任务的解决有着得天独厚的优势,本文先是通过卷积神经网络提取有标签数据和无标签数据的高级语义特征向量;然后基于高级语义特征利用标签传播算法获得无标签数据的伪标签;将带有伪标签的无标签数据集和有标签数据集都放入卷积神经网络模型中进行深度模型的微调。至此,神经网络提取特征与半监督学习的标签预测通过神经网络的微调机制建立起了交互的功能。交互的使用深度模型与标签传播模型不断的优化伪标签直到模型达到收敛。本文在Cifar10数据集上做了一些对比实验最终的实验结果表明:本文提出的算法A,B,C总是比单独使用半监督学习算法或者深度学习算法要好的多。其中,针对800有标签数据,49200无标签数据集在算法C达到了0.91的准确率。 

【文章来源】:温州大学浙江省

【文章页数】:35 页

【学位级别】:硕士

【部分图文】:

基于深度学习的标签传播的图像分类研究


图像识别问题的一个示例

示意图,残差,模块,示意图


温州大学硕士学位论文处理。1.2.2 卷积神经网络简介卷 积 神 经 网 络 经 历 LeNet[18], AlexNet[19], VGG[20], GoogleNet[21](Inception[22]),ResNet[23],Densnet[24]等变革,卷积神经网络变得越来越深,同时训练难度也不断变大。考虑到计算设备,数据集的规模等的制约,迁移学习在计算机视觉中扮演的角色也越来越重要。同时半监督学习对于图片分类任务也是至关重要的,但是仅仅使用浅层机器学习进行标签传播远远无法满足当今社会的需求。从技术角度来看,CNN 是一种至少包含一个卷积层 (有滤波器的作用) 的神经网络。一般地,一个神经元可以看作是线性映射与非线性映射的组合,而多层神经网络是多个神经元按照分层结构组合而成的。神经网络模型的优化方法大都是基于反向传播算法求得的数值解。本文使用了何恺明等[23]人提出的残差网络(ResNet)。 ResNet 网络的基本单元是残差块,见图 2.。

概率分布,半监督学习,图片,特征提取器


图 2-0 本论文研究的基础Figure 2-0 The basis of the research of this thesis把神经网络模型(或者通过 ImageNet 数据集预训练得到的模型)作为特征提取器用来提取图片的高级语义特征向量作为 LLGC 和 GRFH 的输入是十分合理与融洽的。图中 4 张图片的原始特征(像素级别的) 通过特征提取器得到特征向量 ,然后将 作为 LLGC 与 GRFH 的输入即可训练一个基于图的半监督学习模型。这样,本论文将神经网络算法也统一到了传统的基于图的半监督学习模型之中。通过研究高级语义特征向量 来研究 的性质来进一步的判断其类别属性。在某种意义上 与 是等价的,传统图像分类算法不能很好的权衡二者的关系,而神经网络算法恰恰对它们的权衡做出了一定的“暗箱操作”(均统一在同一个神经网络架构之下,不需要特别得考虑二者的过渡问题)。图 2-0 中的 对应于公式 (1-1),而公式 (1-3) 的 与公式 (1-5) 的 分别表示图片的真实类别的概率分布与预测的概率分布。由于图片数据的维度比较高,因而,本论文仅仅考虑卷积神经网络。

【参考文献】:
期刊论文
[1]深度卷积神经网络的发展及其在计算机视觉领域的应用[J]. 张顺,龚怡宏,王进军.  计算机学报. 2019(03)
[2]改进的LLGC高光谱图像半监督分类[J]. 盛振国,王立国.  哈尔滨工程大学学报. 2017(07)
[3]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川.  数据采集与处理. 2016(01)
[4]基于稀疏分解的局部全局一致性学习算法[J]. 白本督,范九伦.  西安邮电大学学报. 2015(03)
[5]一种改进半监督学习的图像语义自动识别方法[J]. 郑浩,廖梦怡.  科技通报. 2014(02)



本文编号:3065927

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3065927.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bd176***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com