面向海量图像检索的视觉编码方法分析与优化

发布时间:2017-11-03 13:06

  本文关键词:面向海量图像检索的视觉编码方法分析与优化


  更多相关文章: 海量图像检索 重力信息 几何信息 乘积量化 稀疏编码


【摘要】:海量图像检索技术是计算机视觉领域研究热点之一。作为一种重要的多媒体搜索技术,它帮助用户在海量图像中快速检索出相关图像。视觉编码的主要工作是将海量图像快速转化成紧凑高效的向量表达,在海量图像检索系统中扮演核心角色,它直接决定海量检索系统的效率以及精度。词袋模型,VLAD,Fisher向量以及稀疏编码等现有主流视觉编码模型为快速准确地进行海量图像检索提供了有力支持。然而上述视觉编码算法也存在一些不足,词袋模型离线训练时间过长;VLAD以及Fisher编码过程没有考虑图像上下文信息;稀疏编码特征集聚算法统计模型较为简单,数学理论解释不充分。因此,针对上述视觉编码算法在码书训练、编码、集聚以及最近邻检索阶段的不足,本文的视觉编码技术分析以及优化研究工作具有重要意义。为分析和优化现有面向海量图像检索的视觉编码方法,本文依次对词袋模型、VLAD以及稀疏编码等视觉编码模型进行理论与实验分析,并结合分布式算法、上下文信息、熵编码理论以及概率统计模型等对上述视觉编码算法进行改进,提高海量图像检索的性能。最后本文在面向海量图像的视觉编码算法研究基础之上构建了一个基于城市级位置服务的移动视觉检索系统。本文完成的主要研究工作包括:1)针对词袋模型训练速度慢,内存消耗大的问题,提出一种基于分布式聚类的词汇树算法训练视觉单词,实现快速准确的码书训练过程。同时提出一种快速的几何重排序算法,利用特征点空间位置信息实现对检索结果的快速几何重排序。2)针对VLAD编码忽略特征点几何信息的问题,提出一种融合重力信息的角度编码以及尺度集聚算法,实现融合上下文信息的VLAD编码。针对乘积量化方法子空间量化误差不均衡的问题,提出基于上下文信息的角度乘积量化方法以及基于熵编码的变长子空间乘积量化方法,分别利用角度子空间以及变长空间维度实现子空间量化误差的均衡。3)针对稀疏编码最大值集聚特征表征不足以及求和集聚受burstiness现象影响的问题,利用概率解释模型提出一种优化的求和集聚算法,实现最大值集聚以及求和集聚的优势融合。同时针对稀疏编码图像检索框架下特征采样以及多特征融合问题进行研究,利用特征采样方法选择的理论分析以及多特征求和集聚实现检索精度的提升。4)搜集构建了一个GPS以及重力信息标注的Beijing Landmark数据库,利用视觉编码算法理论研究实现城市级位置服务的移动视觉检索系统。视觉编码研究中的理论和实验结果都证明了本文研究工作的准确性以及有效性,分布式聚类、上下文信息、熵编码以及概率解释模型等理论在码书训练、特征编码、特征集聚以及最近邻检索阶段极大地优化了现有视觉编码模型,提高了编码效率及精度,本文最后构建的移动视觉检索系统具有准确高效的特点,已成功应用于国家十二五科技重大专项。
【关键词】:海量图像检索 重力信息 几何信息 乘积量化 稀疏编码
【学位授予单位】:北京理工大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
  • 摘要5-7
  • ABSTRACT7-13
  • 第1章 绪论13-40
  • 1.1 研究背景13-15
  • 1.2 海量图像检索技术发展现状15-34
  • 1.2.1 图像局部特征提取与描述15-19
  • 1.2.2 特征编码技术19-29
  • 1.2.3 最近邻搜索技术29-34
  • 1.3 移动视觉检索技术34-36
  • 1.3.1 纯客户端搜索模式35-36
  • 1.3.2 客户端/服务器搜索模式36
  • 1.4 本文的内容与结构36-40
  • 1.4.1 本文研究内容36-38
  • 1.4.2 论文结构38-40
  • 第2章 词袋模型快速码书训练及重排序方法研究40-58
  • 2.1 词袋模型算法中的不足40-41
  • 2.2 分布式聚类的词汇树算法41-47
  • 2.2.1 词汇树算法简介41-43
  • 2.2.2 分布式系统结构设计43-45
  • 2.2.3 分布式聚类算法流程45-47
  • 2.3 快速几何后校验算法47-52
  • 2.3.1 基于量化路径的匹配点集筛选48-49
  • 2.3.2 快速几何一致打分49-51
  • 2.3.3 特征角度/尺度信息一致性打分51-52
  • 2.4 本节实验52-57
  • 2.4.1 实验配置52
  • 2.4.2 测试数据库52-53
  • 2.4.3 分布式算法执行效率53
  • 2.4.4 时间以及内存占用53-56
  • 2.4.5 检索精度56-57
  • 2.5 本章小结57-58
  • 第3章 基于上下文信息的VLAD图像检索方法58-93
  • 3.1 特征点上下文信息58-61
  • 3.2 融合重力信息的角度编码方法61-65
  • 3.2.1 重力自适应的特征主方向61-63
  • 3.2.2 角度量化(Oriented Coding)63-65
  • 3.2.3 基于角度信息的特征编码方法65
  • 3.3 基于尺度信息的特征集聚方法65-70
  • 3.3.1 候选匹配特征点筛选66-68
  • 3.3.2 尺度变化计算68-69
  • 3.3.3 尺度分区集聚69-70
  • 3.4 角度乘积量化(ORIENTED PQ)和变长子空间乘积量化(VPQ)70-80
  • 3.4.1 角度乘积量化(Oriented PQ)71-73
  • 3.4.2 变长子空间乘积量化(Variable Product Quantization)73-80
  • 3.5 实验数据和分析80-92
  • 3.5.1 测试数据库80-81
  • 3.5.2 参数设定81-82
  • 3.5.3 融合重力信息的角度编码方法82-85
  • 3.5.4 尺度集聚算法85-86
  • 3.5.5 特征降维86-87
  • 3.5.6 角度乘积量化(Oriented PQ)87-89
  • 3.5.7 变长子空间乘积量化(VPQ)89-91
  • 3.5.8 其它检索算法框架相结合91-92
  • 3.6 本章小结92-93
  • 第4章 稀疏编码框架特征集聚算法概率解释及应用93-114
  • 4.1 稀疏编码算法93-94
  • 4.1.1 特征编码93-94
  • 4.1.2 特征集聚94
  • 4.2 特征采样方法及选择94-97
  • 4.2.1 稠密采样与稀疏采样94-96
  • 4.2.2 特征采样方法选择96-97
  • 4.3 特征集聚算法概率解释模型97-101
  • 4.3.1 最大值集聚99
  • 4.3.2 求和/均值集聚99-100
  • 4.3.3 集聚算法影响分析100-101
  • 4.4 优化求和集聚算法101-104
  • 4.4.1 峰值抑制101-103
  • 4.4.2 随机误差剔除103-104
  • 4.5 多特征融合104-106
  • 4.5.1 多特征提取105
  • 4.5.2 特征编码及集聚105-106
  • 4.6 参数选择与实验106-113
  • 4.6.1 测试数据库106-107
  • 4.6.2 采样方法对检索精度的影响107-110
  • 4.6.3 优化的求和集聚算法性能110-111
  • 4.6.4 多特征融合性能111-113
  • 4.7 本章小结113-114
  • 第5章 移动视觉检索系统114-125
  • 5.1 移动视觉检索简介114-115
  • 5.2 传统移动视觉检索技术架构115
  • 5.3 面向城市级位置服务的移动视觉检索系统115-124
  • 5.3.1 服务器端116-119
  • 5.3.2 移动客户端119-121
  • 5.3.3 实验及参数设定121-124
  • 5.4 本章小结124-125
  • 第6章 总结和展望125-127
  • 6.1 本文总结125-126
  • 6.2 展望126-127
  • 参考文献127-138
  • 攻读博士学位期间发表论文与研究成果清单138-140
  • 致谢140-142
  • 作者简介142

【参考文献】

中国期刊全文数据库 前2条

1 张运超;陈靖;王涌天;;基于城市级位置服务的移动增强现实[J];电子学报;2014年08期

2 张运超;陈靖;王涌天;刘越;;基于移动增强现实的智慧城市导览[J];计算机研究与发展;2014年02期



本文编号:1136297

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1136297.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a44bb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com