当前位置:主页 > 科技论文 > 自动化论文 >

偏标记学习算法及其在图像分类中的应用研究

发布时间:2020-11-20 04:43
   传统的监督学习需要明确的监督信息,而为示例标注明确的监督信息需要耗费大量的人力和物力,甚至有的标注需要专门的人才才能完成。弱监督学习不仅不需要强监督信息,并且弱监督学习框架更加符合现实生活中的场景,因此弱监督学习框架在机器学习领域受到了广泛关注。偏标记学习是弱监督学习中的一种。在偏标记学习中,每个示例对象都有一个候选集合,该集合带有多个标签信息,其中真正的标签只有一个。偏标记学习的难点主要在以下三个方面,第一是训练示例对应的标签信息是一个集合,而不是明确地指出其对应的真正标签。第二是候选集合中的标签存在相似性。第三是示例与标签之间的联系很难充分利用。基于以上分析,本文提出了两个基于偏标记学习的算法。为了充分利用示例空间与标签空间之间的相似性,本文提出了一个基于低秩和标签传播的偏标记图像分类算法。该算法的创新点有三个,首先基于流行假设充分利用了示例空间和标签空间之间的相似性。流行假设的思想是在示例空间中相似的示例在标签空间中也具有同样的相似性,因此基于流行假设能够将示例空间与标签空间联系起来。其次基于低秩表示矩阵构建示例之间的相似性。相对于基于距离度量的相似性构建方式,该算法采用的低秩表示方式能够构建全局空间并且对高维数据有更好的效果。在构建低秩表示矩阵时加入了稀疏约束,减少示例不平衡对低秩表示矩阵的影响。最后并没有以最大概率值作为对应示例的真正标签,而是将其转换成了一个多输出回归问题。由于矩阵中可能会存在消歧效果不明显的标签,所以候选标签集合中的概率值可能存在平均概率的情况。不以最大概率值做为对应示例的真正标签,减少伪正例对预测模型的影响。大量实验证明了使用低秩表示矩阵表示示例与示例之间的相关性,并且将这种相关性延伸到标签空间对分类性能有很大作用。为了突显出真正的标签,本文提出了一个基于标签最大置信度的偏标记图像分类算法。该算法主要有两个创新点,第一是在模型的损失项中增加每个示例置信度的无穷范数,突出候选标签集合中的真正示例。平均消歧策略有一个很大的弊端即消歧后的置信度矩阵中存在消歧效果不明显的示例。该算法改善平均消歧策略劣势,突出候选标签中的真正标签。第二是基于图拉普拉斯约束项充分利用示例之间的相似性。图拉普拉斯项使目标函数中的相似示例会有相似输出,使得突出的标签接近真正的标签。大量的实验结果表明,基于标签最大置信度的方法在图像分类问题上有着很好的性能。
【学位单位】:北京交通大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP181;TP391.41
【部分图文】:

自动采集,图例,示例


2.1偏标记学习理论综述??2.1.1偏标记学习框架定义??通过新闻报到以及社交媒体能够获得大量图片和对应的标签信息。由图2-1??所示,通过人脸检测算法和人名抽取算法,能够获取一下图像,并且为这些图片??标注大致的信息范围。经过对现有的弱监督学习框架进行分析和比较,发现没有??满足上述条件的学习框架,为了方便构建学习模型,研宄学者提出了偏标记学习??的概念。由于每个人的理解不同,所以偏标记学习在一些英文文献中出现了不同??的命名,偏标记学习最常用的命名是partial?label?learning?[13_15,2G’21]。在文献[5,7,12,22]??称之为?ambiguous?label?learning,文献[8]称之为?superset?label?learning,文献[23]称??之为?learning?from?candidate?labeling?sets。??Z1?0?II?Tiinr—?L2??标记如练样本^???ESBBHPiniBESHB?偏标记训练?fif?本?2??11月10日,美国总统S巴马人名油^?11月10日,美国I?R-rm??(右〉在华盛顿白宫会见当迭总统右疮华齙铂莒会见当迭总统?3^p>?;纳一.特朗过;??屋纳德?特朗窖。(照片来源:新?^唐5拢刻乩室簦辏牐ㄕ掌?矗保盒??一?'?B?:??华网/麵)??图2-1自动采集偏标记训练示例的图例??Figure?2-1?Example?for?collecting?partial?label?learning?instances??在偏标记学习中

框架图,框架,标签,图例


图2-2四种弱监督学习框架??Figure?2-2?Four?types?of?weakly?supervised?learning?framework??图2-2以图例的形式展示了在这四种弱监督学习框架中示例和标签之间的关??系。这四种框架都是根据不同的弱监督信息提出来的框架,下面将偏标记与其它??三种弱监督框架进行比较,表述内容如下:??(1)

流程图,图像分类,流程图


Figure?2-3?The?flow?diagram?of?image?classification??偏标记学习是一种示例标签信息带噪声的弱监督学习框架,处理的是示例的??标签信息唯一并且在候选集合中这一类问题。图2-3表示的是在强监督学习框架下??构建分类器,然而真实生活中强监督信息比较难获取,并且需要耗费大量人力和??物力,所以基于弱监督学习的图像分类更加受到学者的关注。在实际应用中我们??可以通过图片和文本识别算法,提取到图像和相应的候选集合,在此条件下,基??于偏标记学习框架构建的图像分类模型更加符合需求。通常获取到图像和相应的??候选集合,通过特征提取之后,接下来的步骤就是基于偏标记学习框架构建分类??模型,其流程图如图2-4所示:??Monicas?Rachels?Phoebe??一Monica、Rachel、Phoebe??隨遍Monicas?RacheK?Phoebe?,??r?一??图片预处理以及特征提取??t.??^?u??』??"u?r??构建基于偏标记学习框架的分类器??L.?■?■?.j??r-?_?丨Ilflr????丨丨 ̄"??预铡标签??l?....?-d??图2-4基于偏标记学习框架的图像分类??Figure?2-4?The?image?classifica
【参考文献】

相关博士学位论文 前1条

1 吴丽娜;基于词袋模型的图像分类算法研究[D];北京交通大学;2013年



本文编号:2890967

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2890967.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户75482***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com