基于弱监督的图像区域自动标注算法研究
本文关键词:基于弱监督的图像区域自动标注算法研究
【摘要】:在本文中,我们关注一个挑战性的问题—基于弱监督的图像区域标注,即在数据集中只有图像层标签这种弱监督信息可以使用。图像区域标注在计算机视觉以及图像信息检索领域中有广阔的应用场景,并且能够在一定程度上打破高层语义和在计算机中图像的低层像素表示之间的语义鸿沟。传统的图像区域标注问题需要大量的带有区域标签的数据,但是标注这些数据是非常耗时耗力的。图像层的标签,对于图像区域标注这较为细粒度任务具有非常的不确定性,但是图像层标签非常容易获得。各种互联网数据的爆炸式产生也为弱监督问题提供了大量的初始数据。弱监督图像区域标注目前仅有较少的研究工作,本文主要有以下贡献:一、对弱监督学习的解决方法进行了完整的综合性介绍。在弱监督学习过程中,由于数据具有不确定性,通常情况下,需要借助上下文的信息来降低样本标签的不确定性,我们称为协同标注。我们首先介绍了KNN和稀疏编码两种方式来寻找目标的上下文信息,同时我们介绍了如何使用这种上下文信息构建语义图以及如何在图上进行标签的传播,本文中我们介绍了两种标签传播的方法,马尔科夫随机游走以及谱聚类。二、提出了基于判别语义的构建上下文的方法。我们注意到,弱监督的图像区域的标注传播主要问题在于如何找到有效的上下文信息进行协同标注,而传统的完全基于相似性的上下文获取方式容易导致过同质化问题,即上下文超像素中的视觉信息以及图像层标签都非常相似,各种语义标签共现现象导致目标超像素的标签具有不确定性。所以我们提出了基于判别语义的上下文查询方式,我们对判别语义进行了定义,在上下文查询中,不仅仅考虑视觉相似性和语义相关性,还考虑判别语义(Discriminative Semantics)的信息。我们提出了如何根据判别语义信息构建判别语义图(Discriminatively Semantic Graph,DSG)。三、我们提出了如何在构建的判别语义图上面进行标签的传播。我们通过构建两种语义图将标签传播分为两个部分,在inter-image图(DSG)上我们考虑不同图像间的上下文信息来得到超像素的标签分布概率。在每个intra-image图上我们考虑每张图像的相邻超像素节点的视觉信息和语义标签来建立能量函数,通过Graph Cuts方法求解能力函数得到最终超像素的标签分配。我们的实验是在两个数据集MSRC-21以及PASCAL VOC 2007上进行的,使用平均类别准确率以及单一类别准确率作为评测的指标。我们的方法在两个数据集的多个单一类别以及平均类别准确率都取得了较高的准确率,进而证明了我们方法的有效性。
【关键词】:弱监督 图像区域标注 判别语义图
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 摘要8-10
- ABSTRACT10-12
- 第一章 绪论12-17
- 1.1 研究背景12-13
- 1.2 相关工作13-14
- 1.3 我们的方法14-17
- 第二章 图像区域的获取和表示17-27
- 2.1 图像区域获取17-23
- 2.1.1 SLIC分割17-20
- 2.1.2 基于谱聚类的图像分割20-23
- 2.2 图像区域的描述23-26
- 2.2.1 颜色直方图23-24
- 2.2.2 基于视觉词袋的视觉描述24-26
- 2.3 本章小结26-27
- 第三章 弱监督图像区域标注相关方法27-38
- 3.1 常用符号27-29
- 3.2 弱监督中图像区域的协同标注29-33
- 3.2.1 KNN上下文搜索30-31
- 3.2.2 Sparsity Coding上下文搜索31-33
- 3.3 基于图的标签传播方法33-37
- 3.3.1 随机游走方法34-35
- 3.3.2 谱聚类方法35-37
- 3.5 本章小结37-38
- 第四章 基于判别语义图方法38-46
- 4.1 判别语义图的构建38-42
- 4.2 判别式标签传播42-43
- 4.3 标签推断分配43-44
- 4.4 本章小结44-46
- 第五章 实验与分析46-50
- 5.1 数据集合实验设置46-47
- 5.2 评测标准分析47
- 5.3 标注结果47-49
- 5.4 时间复杂度分析49
- 5.5 本章小结49-50
- 第六章 结论与展望50-52
- 6.1 结论50-51
- 6.2 展望51-52
- 参考文献52-55
- 致谢55-56
- 攻读学位期间发表的学术论文目录56-57
- 攻读学位期间参加的科研项目57-58
- 附件58
【相似文献】
中国期刊全文数据库 前10条
1 杨根福;;图像区域选择方法与技巧[J];印刷杂志;2009年12期
2 王俊文;刘光杰;张湛;戴跃伟;王执铨;;图像区域复制篡改快速鲁棒取证[J];自动化学报;2009年12期
3 胡卫平,邱静,陆菊康;一种数字图像区域处理技术的设计与应用[J];微计算机应用;2000年06期
4 史进玲;;一种度量图像区域相似性的粒计算方法[J];科技信息;2012年26期
5 赵勇;方宗德;田丽丽;;列车车轮踏面缺陷的图像区域提取[J];光学精密工程;2009年04期
6 佟强;;图像区域粗糙分割情况下的区域物体分类[J];计算机辅助设计与图形学学报;2010年07期
7 余绍鹏;胡永健;谭莉玲;;基于模式分类的图像区域作伪检测[J];计算机工程与设计;2012年02期
8 林意;吴锡生;;一种图像区域边缘表达方法[J];重庆大学学报(自然科学版);2006年07期
9 李峰;刘运松;马婷婷;;一种图像区域复制篡改的检测算法[J];微计算机信息;2011年11期
10 王涤琼,张薇,顾国庆;用顶点链编码计算图像区域密集度和体态比[J];华东师范大学学报(自然科学版);2005年01期
中国重要会议论文全文数据库 前1条
1 佟强;;图像区域粗糙分割情况下的区域物体分类[A];第四届全国几何设计与计算学术会议论文集[C];2009年
中国博士学位论文全文数据库 前2条
1 郭乔进;基于上下文的图像区域标注关键技术研究[D];南京大学;2013年
2 赵洁;数字图像区域复制篡改的被动取证方法研究[D];天津大学;2015年
中国硕士学位论文全文数据库 前8条
1 徐小程;基于弱监督的图像区域自动标注算法研究[D];山东大学;2016年
2 聂云英;数字图像区域复制篡改被动盲取证新方法研究[D];湖南大学;2011年
3 丁轶;基于LDA的图像区域标注模型的研究[D];南京大学;2012年
4 欧佳佳;图像区域复制粘贴篡改检测研究[D];长沙理工大学;2012年
5 徐萍;基于JPEG的感兴趣图像区域压缩算法的设计与实现[D];华中科技大学;2011年
6 梁爽爽;抗自然干扰的图像区域复制篡改盲检测算法研究[D];沈阳工业大学;2015年
7 滕舟;基于多标签学习的图像区域语义自动标注算法研究[D];复旦大学;2011年
8 杨素娣;图像区域个数统计、图像重现和图像旋转算法的研究[D];华东师范大学;2007年
,本文编号:723436
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/723436.html