面向大规模多模态图像检索的关键技术研究及系统实现
本文选题:哈希 + 多模态 ; 参考:《山东大学》2017年硕士论文
【摘要】:随着互联网的广泛普及以及信息技术的不断进步,相较于文字,人们越来越倾向于使用图像来表达、传递和获得信息。由此,互联网上图像的数量呈现出爆炸性增长趋势,应用大规模图像数据面临着巨大的挑战。如何快速且准确的从大规模图像数据中检索到相似图像是图像检索领域长期以来研究的热点问题之一。机器学习是处理大规模数据的重要工具之一,其中哈希学习由于其可以减少数据的存储空间以及优越的计算性能,在近年来成为研究热点。哈希学习将高维空间的数据经过映射到低维的汉明空间,得到紧凑的二进制码(哈希码),从而减少数据的存储空间;在获得哈希码的同时,使得学习得到的哈希码保持住原始空间数据间的相似性,在进行检索时,只需要计算哈希码间的汉明距离,就可以快速的得到数据间的相似度,降低计算速度,从而提升检索效率。本文在谱哈希的基础上提出一种面向多模态图像检索的离散哈希方法(Discrete Multi-view Hashing,简称DMVH)。该方法可以利用图像丰富的多模态信息提升检索的性能。首先,提取图像的多模态特征(如GIST、SIFT),并对多模态特征进行预处理,使得多模态特征的维数保持一致。然后,使用一种新的构建图像数据间相似性矩阵的方法,在保留数据局部结构相似性的同时,保持住数据之间的语义相似性。最后,将高维空间的数据通过学习得到的映射矩阵映射到低维空间得到哈希码。由于哈希码是离散的,直接对其进行优化比较困难。基于此,又引入两个辅助变量,使得在优化过程中不用松弛离散条件,减小优化误差,从而得到更高质量的哈希码。本文在三个公开的数据集上对DMVH的性能进行验证,并且与几个较先进的哈希方法进行比较,实验结果表明本文DMVH的性能要优于所比较的哈希方法的性能。最后,以DMVH为核心算法,设计并实现了多模态图像检索系统。该系统主要是将"以图搜图"的功能提供给用户。用户将所需要检索的图像上传到系统中,在对图像进行特征提取、特征融合后,使用在DMVH学习过程中得到的哈希函数将融合过的特征映射到汉明空间,生成哈希码,并计算该哈希码与数据库中已保存的哈希码之间的汉明距离,将与检索图像哈希码汉明距离小的哈希码对应的图像作为检索结果返回给用户,最终实现"以图搜图"的检索功能。
[Abstract]:With the popularity of the Internet and the continuous progress of information technology, people are more and more inclined to use images to express, transfer and obtain information. As a result, the number of images on the Internet is increasing explosively, and the application of large scale image data is facing a great challenge. How to retrieve similar images quickly and accurately from large scale image data is one of the hot issues in the field of image retrieval for a long time. Machine learning is one of the most important tools to deal with large-scale data. Hash learning has become a hot research area in recent years because it can reduce the storage space of data and improve computing performance. Hash learning maps high-dimensional space data to low-dimensional hamming space, resulting in compact binary code (hash code), which reduces the storage space of data. The learning hash code keeps the similarity between the original spatial data. In the retrieval, only the hamming distance between the hash codes is calculated, the similarity between the data can be obtained quickly, and the computing speed can be reduced. In order to improve the efficiency of retrieval. Based on spectral hashing, a discrete hash method for multimodal image retrieval is proposed in this paper. This method can improve the performance of retrieval by using abundant multi-modal information. Firstly, the multi-modal features (such as GIST / sift) are extracted, and the multi-modal features are preprocessed to make the dimension of the multi-modal features consistent. Then, a new method of constructing similarity matrix between image data is proposed to preserve the similarity of the local structure of the data and the semantic similarity of the data at the same time. Finally, the data of high dimensional space is mapped to the low dimensional space by learning the mapping matrix to obtain the hash code. Since hash codes are discrete, it is difficult to optimize them directly. Based on this, two auxiliary variables are introduced, so that the optimization error can be reduced without loosening discrete conditions in the optimization process, and a higher quality hash code can be obtained. This paper verifies the performance of DMVH on three open datasets and compares it with several more advanced hash methods. The experimental results show that the performance of DMVH in this paper is better than that of the compared hash method. Finally, a multimodal image retrieval system is designed and implemented with DMVH as the core algorithm. The system mainly provides the function of "map searching" to users. Users upload the images they need to retrieve to the system. After feature extraction and feature fusion, the fused features are mapped to hamming space by using the hash function obtained in the process of DMVH learning, and the hash codes are generated. The hamming distance between the hash code and the stored hash code in the database is calculated, and the image corresponding to the hash code corresponding to the small hamming distance of the retrieval image hash code is returned to the user as the retrieval result. Finally, the retrieval function of "search map by map" is realized.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 江士方,汪英姿;图像及图像检索应用前景的探讨[J];江苏工业学院学报(社会科学版);2003年04期
2 韩法旺;;基于云计算模式的图像检索研究[J];情报科学;2011年10期
3 何岩;;以计算机为基础的色彩图像检索方法与研究[J];计算机光盘软件与应用;2013年12期
4 郭海凤;李广水;仇彬任;;基于融合多特征的社会网上图像检索方法[J];计算机与现代化;2013年12期
5 柏正尧,周纪勤;基于复数矩不变性的图像检索方法研究[J];计算机应用;2000年10期
6 夏峰,张文龙;一种图像检索的新方法[J];计算机应用研究;2002年11期
7 邓诚强,冯刚;基于内容的多特征综合图像检索[J];计算机应用;2003年07期
8 斯白露,高文,卢汉清,曾炜,段立娟;基于感兴趣区域的图像检索方法[J];高技术通讯;2003年05期
9 刘怡,于沛;基于“知网”的新闻图像检索方法[J];河南师范大学学报(自然科学版);2003年02期
10 张荣,郑浩然,李金龙,王煦法;进化加速技术在图像检索中的应用[J];计算机工程与应用;2004年16期
相关会议论文 前10条
1 陈旭文;朱红丽;;一种高效的图像检索方法[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
2 周向东;张亮;张琪;刘莉;殷慷;施伯乐;;一种新的图像检索相关反馈方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 陈世亮;李战怀;闫剑锋;;一种基于本体描述的空间语义图像检索方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 赵海英;彭宏;;基于最优近似反馈的图像检索[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
5 许相莉;张利彪;于哲舟;周春光;;基于商空间粒度计算的图像检索[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
6 李凌伟;周荣贵;刘怡;;基于概念的图像检索方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 杨关良;李忠杰;徐小杰;;基于代表色的图像检索方法研究[A];首届信息获取与处理学术会议论文集[C];2003年
8 彭瑜;乔奇峰;魏昆娟;;基于多示例学习的图像检索方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 胡敬;武港山;;基于语义特征的风景图像检索[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
10 许天兵;;一种基于语义分类的图像检索方法[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
相关博士学位论文 前10条
1 崔超然;图像检索中自动标注、标签处理和重排序问题的研究[D];山东大学;2015年
2 杨迪;基于内容的分布式图像检索[D];北京邮电大学;2015年
3 张旭;网络图像检索关键技术研究[D];西安电子科技大学;2014年
4 吴梦麟;基于半监督学习的医学图像检索研究[D];南京理工大学;2015年
5 高毫林;基于哈希技术的图像检索研究[D];解放军信息工程大学;2014年
6 李清亮;图像检索中判别性增强研究[D];吉林大学;2016年
7 刘爽;多特征融合图像检索方法及其应用研究[D];哈尔滨理工大学;2016年
8 程航;密文JPEG图像检索研究[D];上海大学;2016年
9 李强;基于语义理解的图像检索研究[D];天津大学;2015年
10 李展;基于多示例学习的图像检索与推荐相关算法研究[D];西北大学;2012年
相关硕士学位论文 前10条
1 赵鸿;基于尺度不变局部特征的图像检索研究[D];华南理工大学;2015年
2 孙剑飞;基于图像索引的热点话题检索方法研究[D];兰州大学;2015年
3 章进洲;图像检索中的用户意图分析[D];南京理工大学;2015年
4 苗思杨;移动图像检索中的渐进式传输方式研究[D];大连海事大学;2015年
5 都业刚;基于显著性的移动图像检索[D];大连海事大学;2015年
6 王梦蕾;基于用户反馈和改进词袋模型的图像检索[D];南京理工大学;2015年
7 许鹏飞;基于草图的海量图像检索方法研究[D];浙江大学;2015年
8 冯进丽;基于BoF的图像检索与行为识别研究[D];山西大学;2015年
9 乔维强;基于低级特征和语义特征的医学图像检索[D];北京理工大学;2015年
10 蒋国宝;基于内容的概念建模和图像检索重排序[D];复旦大学;2014年
,本文编号:1906552
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1906552.html