当前位置:主页 > 科技论文 > 搜索引擎论文 >

面向图像检索的视觉特征提取及语义标注

发布时间:2017-05-10 01:07

  本文关键词:面向图像检索的视觉特征提取及语义标注,由笔耕文化传播整理发布。


【摘要】:目前面向图像的搜索引擎主要有两种:一是基于文本信息的图像检索系统,根据图像信息通过人工进行文本描述,该方式是在早期图像量不大的时候提出的。现在面对浩如烟海的图片量,手工标注的方式,劳力耗费太大,并且具有较强的主观性,标注的人根据自己的认知进行判断,图片反馈的信息很大程度上跟人的心理活动有关,因此这种检索方式已经越来越不能满足现在的要求。二是基于图像视觉内容的图像检索系统。主要是通过提取稳定的图像视觉特征并形成描述子,构建以距离相似度为索引方式进行检索,返回按照底层特征相似度大小排序的图像。但是人们检索的思维习惯是在语义基础上,视觉底层相似的图像可能表达不同的语义信息,视觉特征不相同的图像的语义信息有可能是相同的。这就是通常意义上基于内容图像检索带来的“语义鸿沟”。本文就此展开研究,在机器学习的基础上,将图像底层视觉特征与高层语义建立映射关系,结合监督学习和非监督学习两种方式构建语义标注模型。选用Dense SIFT采样形成SIFT局部描述符,完成对图像的特征提取和描述。由于特征维数较大,对每个描述符进行降维,接下来对特征进一步表达,分别选用词袋(Bag of Word, BOW)、局部特征聚合描述符(Vector of Locally Aggregated Descriptors, VLAD)、Fisher向量(Fisher Vector, FV)。FV相对BOW具有较大的数据编码优势,用较少的视觉词典形成更加细致的中间表达。为了弥补特征描述子的不足,引入了空间金字塔的特征表示方法,丰富了图像特征空间信息,最后使用支持向量机标注图像语义。图像语义标注模型被建立,图像检索可通过语义特征实现。但语义空间内相似图像太多,有时仍不能满足用户的需求。因此在此基础上,本文在图像检索系统上加入图像底层视觉特征的直接索引作为辅助检索,能够按照用户视觉上相似度进行排序,进一步实现精确查找。该实现方法兼顾了由有监督学习的方式得到的图像语义特征和由无监督学习的方式得到的底层视觉特征两种方式的优点,不仅实现了更符合人思维习惯的图像检索方式,通过自然语言描述的视觉概念查找,而且极大的提高了图像检索系统的有效性和准确性。
【关键词】:图像检索 特征提取 空间金字塔 图像语义
【学位授予单位】:长春工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
  • 摘要2-3
  • Abstract3-7
  • 第一章 绪论7-11
  • 1.1 课题的研究背景及意义7-8
  • 1.2 国内外研究现状8-9
  • 1.3 本文的主要研究内容及各章节的安排9-11
  • 第二章 图像检索的视觉特征提取方法11-24
  • 2.1 颜色特征11-15
  • 2.1.1 颜色直方图13-14
  • 2.1.2 颜色相关图14-15
  • 2.1.3 颜色矩15
  • 2.2 空间/频率域的纹理特征15-18
  • 2.2.1 基于Gabor小波纹理特征提取15-17
  • 2.2.2 离散小波变换的纹理特征提取17-18
  • 2.3 形状特征18-19
  • 2.3.1 傅立叶形状描述子18-19
  • 2.3.2 形状无关矩19
  • 2.4 SIFT特征描述子19-23
  • 2.4.1 DoG尺度空间生成19-20
  • 2.4.2 特征点的搜索20-21
  • 2.4.3 确定关键点位置及尺度21-22
  • 2.4.4 确定关键点方向22
  • 2.4.5 生成特征描述子22-23
  • 2.5 小结23-24
  • 第三章 图像语义提取24-33
  • 3.1 主成分分析(Principal Components Analysis,PCA)24-26
  • 3.2 K-Means聚类算法26-27
  • 3.3 高斯混合模型(Gaussian Mixture Model,GMM)27-28
  • 3.4 支持向量机(SVM)28-32
  • 3.4.1 线性支持向量30-31
  • 3.4.2 非线性支持向量31-32
  • 3.5 小结32-33
  • 第四章 基于不同特征表达的图像语义标注33-45
  • 4.1 图像的密集采样SIFT33-34
  • 4.2 图像表示模型34-40
  • 4.2.1 视觉词袋(Bag of Visual Words)34-36
  • 4.2.2 Fisher Vector特征36-37
  • 4.2.3 局部特征聚合描述符37-38
  • 4.2.4 空间金字塔(Spatial Pyramid)38-40
  • 4.3 支持向量机的核函数40-42
  • 4.3.1 径向基函数RBF(Radial Basis Function)40-41
  • 4.3.2 直方图交叉核函数(Histogram Intersection Kernel Function)41-42
  • 4.4 实验及结果分析42-43
  • 4.5 小结43-45
  • 第五章 图像检索系统设计与仿真45-54
  • 5.1 图像检索的索引45
  • 5.2 综合多特征和语义的图像检索45-47
  • 5.3 系统评价参数47-48
  • 5.4 实验结果48-52
  • 5.5 小结52-54
  • 第六章 总结和展望54-56
  • 6.1 研究工作总结54-55
  • 6.2 展望55-56
  • 致谢56-57
  • 参考文献57-62
  • 作者简介62
  • 攻读硕士学位期间研究成果62-63

【参考文献】

中国期刊全文数据库 前7条

1 丁世飞;齐丙娟;谭红艳;;支持向量机理论与算法研究综述[J];电子科技大学学报;2011年01期

2 刘现平;宋良图;;综合颜色和空间信息的图像检索[J];计算机工程与应用;2005年35期

3 张元清;包骏杰;况夯;钟洪;;基于贝叶斯理论的图像标注和检索[J];计算机科学;2008年08期

4 阿卜杜如苏力·奥斯曼;吐尔洪江·阿布都克力木;马丽亚木·阿布来孜;;综合颜色特征与形状特征的图像检索算法[J];计算机工程与应用;2013年07期

5 周书仁;殷建平;;基于Haar特性的LBP纹理特征[J];软件学报;2013年08期

6 徐庆;杨维维;陈生潭;;基于内容的图像检索技术[J];计算机技术与发展;2008年01期

7 孟繁杰;郭宝龙;;使用兴趣点局部分布特征及多示例学习的图像检索方法[J];西安电子科技大学学报;2011年02期

中国硕士学位论文全文数据库 前1条

1 张磊;图像分类和图像语义标注的研究[D];山东大学;2008年


  本文关键词:面向图像检索的视觉特征提取及语义标注,由笔耕文化传播整理发布。



本文编号:353684

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/353684.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9210e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com