基于内容的大规模图像检索技术研究
本文关键词:基于内容的大规模图像检索技术研究
更多相关文章: 大规模图像检索 图像描述符 残差投影量化 二级邻接图 不完全检索
【摘要】:随着互联网和数字成像设备的普及,积聚数字图像的各种网络社区得到了迅速发展,包含大量图像的数据库也随之不断出现,如何从这些海量图像数据库中快速检索出满足用户需求的图像已成为多媒体应用领域中一个重要的主题。为了实现精确而快速的图像检索,解决图像检索中的图像内容精确表示,大规模检索的存储约束以及检索效率等问题,从图像描述符,近似最近邻检索以及高维向量索引等几个方面进行了深入的研究。 针对全局描述符VLAD的区分度与存储大小之间的矛盾,提出了一种增强的图像描述符,其通过两层视觉码书来生成图像的VLAD描述符,即图像的局部特征的残差向量基于细粒度的第二层视觉子码书而产生,而残差向量的累积基于粗粒度的第一层视觉子码书。另外,针对图像局部特征非均匀分布,对第二层视觉子码书提出了优化措施。实验结果表明,两层码书及优化策略能显著提高固定大小的VLAD描述符的区分度。 针对在向量原始空间训练量化器及向量量化编码时间开销过大的缺陷,设计了残差投影量化器,并将其用于近似最近邻检索。残差投影量化器由多阶段子量化器组成,在每一个阶段子量化器训练过程中,借助主成分分析将高维向量投影到低维空间,并通过K均值聚类算法在低维空间生成子量化器的视觉码书,量化产生的残差则反投影到原始空间用于训练下一阶段子量化器。另外,以训练阶段和量化阶段的总体误差最小化为目标,提出了相应阶段的优化措施。查询时,所采用的非对称距离计算及查找表很好的满足了大规模高维向量检索的精度和效率需求。 为了提高检索效率,提出了基于二级邻接图的索引结构。第一级邻接图反映的是转换积量化器视觉码书和数据库向量的近邻关系,用于快速生成查询的近邻种子,在第一级邻接图的生成过程中,采用逆向生成模式,即先将数据库向量分配给转换积量化器的多个最近邻视觉码字,然后,再为每个视觉码字保留少数几个最近邻数据库向量。第二级邻接图反映的是数据库向量到自身的近邻关系,用于近邻传递,为了快速生成第二级邻接图,采用了一种基于划分树的邻接图近似构建算法。基于 二级邻接图进行查询时,对于给定的查询向量,先快速检索到该查询向量在转换积量化器视觉码书中的最近邻视觉码字,并基于第一级邻接图的邻接关系快速生成查询向量的最近邻种子,对每一个最近邻种r,基于第二级邻接图的邻接关系实现近邻传递,重复上述过程直到检索到的最近邻个数满足指定的阈值为止。基于二级邻接图的不完全检索很好的解决了大规模检索的实时需求。 基于内容的大规模图像检索需要研究的问题还有很多。在图像描述符方面,如何融合多种视觉特征用于生成图像描述符以更好的表达图像内容是需要进一步研究的问题。在快速最近邻检索方面,基于哈希的方法虽然速度较快但普遍精度较低,如何利用语义信息提高基于哈希的近似最近邻检索精度是另一个需要进一步研究的问题。
【关键词】:大规模图像检索 图像描述符 残差投影量化 二级邻接图 不完全检索
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
- 摘要4-6
- Abstract6-9
- 目录9-11
- 1 绪论11-32
- 1.1 引言11
- 1.2 研究背景与意义11-12
- 1.3 国内外研究现状12-28
- 1.4 主要研究工作及其创新点28-30
- 1.5 论文组织结构30-32
- 2 增强的图像描述符32-48
- 2.1 问题分析32-33
- 2.2 VLAD图像描述符33-35
- 2.3 增强的VLAD图像描述符35-42
- 2.4 实验结果及性能分析42-46
- 2.5 本章小结46-48
- 3 基于残差投影量化的近似最近邻检索48-77
- 3.1 问题分析48-49
- 3.2 基于残差投影量化的近似最近邻检索49-59
- 3.3 实验结果及性能分析59-76
- 3.4 本章小结76-77
- 4 基于二级邻接图的不完全检索77-111
- 4.1 问题分析77-78
- 4.2 二级邻接图及其构建78-95
- 4.3 基于二级邻接图的不完全检索95-97
- 4.4 实验结果及性能分析97-109
- 4.5 本章小结109-111
- 5 总结与展望111-114
- 5.1 研究总结111-112
- 5.2 存在不足112-113
- 5.3 研究展望113-114
- 致谢114-115
- 参考文献115-127
- 附录一 攻读学位期间发表学术论文目录127-128
- 附录二 攻读学位期间完成和参与的项目128
【相似文献】
中国期刊全文数据库 前10条
1 张桂榕;;反向最近邻查询研究综述[J];电脑知识与技术;2011年28期
2 周屹;;不确定对象的反向最近邻查询研究[J];黑龙江工程学院学报(自然科学版);2012年04期
3 刘永山,薄树奎,张强,郝忠孝;多对象的最近邻查询[J];计算机工程;2004年11期
4 郝忠孝;刘永山;;空间对象的反最近邻查询[J];计算机科学;2005年11期
5 王淼;郝忠孝;;不确定性对象的反向最近邻查询[J];计算机工程;2010年10期
6 张旭;何向南;金澈清;周傲英;;面向不确定图的k最近邻查询[J];计算机研究与发展;2011年10期
7 杨泽雪;郝忠孝;;空间数据库中的障碍反向最近邻查询[J];计算机工程与应用;2011年34期
8 王丹丹;郝忠孝;;道路网络中的多类型K最近邻查询[J];计算机工程与应用;2012年03期
9 邓瑾;周梅;;基于R树及其变种的最近邻查询研究[J];现代计算机;2013年09期
10 朱婧;;平面中点对一般多边形的最近邻查询研究[J];科技通报;2014年01期
中国重要会议论文全文数据库 前10条
1 张晓峰;王丽珍;肖清;赵丽红;;基于概念划分的连续最近邻查询研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 管猛;张剡;柏文阳;;基于地表的连续可见最近邻查询方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 陈璐;高云君;柳晴;陈刚;;受限相互最近邻查询处理[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
4 盛梅红;沙朝锋;宫学庆;嵇晓;周傲英;;道路网络环境中的多对象最近邻查询[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 刘月清;章勇;;一种改进的动态最近邻聚类算法[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
6 李传文;谷峪;李芳芳;于戈;;一种障碍空间中不确定对象的连续最近邻查询方法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
7 刘星毅;;基于欧式距离的最近邻改进算法[A];广西计算机学会2010年学术年会论文集[C];2010年
8 刘先康;梁菁;任杰;蒋光庆;;修正最近邻模糊分类算法在舰船目标识别中的应用[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
9 刘俊岭;孙焕良;;多维度量空间中发现相互kNN(英文)[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
10 余小高;;P2P环境中k最近邻搜索算法研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
中国博士学位论文全文数据库 前8条
1 魏本昌;基于内容的大规模图像检索技术研究[D];华中科技大学;2015年
2 杨泽雪;空间连接及最近邻变体查询研究[D];哈尔滨理工大学;2014年
3 孙冬璞;时空数据库多类型最近邻查询的研究[D];哈尔滨理工大学;2010年
4 王建峰;基于哈希的最近邻查找[D];中国科学技术大学;2015年
5 张得天;时间依赖路网高效k最近邻查询混搭机制的研究[D];中国科学技术大学;2014年
6 杜钦生;高维空间的K最近邻查询及连接问题研究[D];吉林大学;2015年
7 张军旗;支持最近邻查找的高维空间索引[D];复旦大学;2007年
8 李艳红;路网中移动对象最近邻及反向最近邻查询处理研究[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨根茂;基于哈希加速的近似最近邻检索算法研究[D];浙江大学;2015年
2 原s,
本文编号:932856
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/932856.html