当前位置:主页 > 科技论文 > 自动化论文 >

基于深度卷积神经网络的语义图像检索研究

发布时间:2018-12-23 13:36
【摘要】:图像检索问题作为计算机视觉的一个基本问题,已经有很多学者对它进行过分析和研究。本世纪初,人们逐渐认识到低级特征和高级语义特征之间固有的“语义鸿沟”,开始涉及基于语义的图像检索,但收效甚微。近年来,深度学习技术为饱受到传统人工特征困扰的基于语义的图像检索问题打开了新的大门。相比较传统方法,深度学习模型在挖掘深层次特征上有惊人的能力,更可能满足图像语义特征学习。但是,深度学习本身也处在一个快速发展的阶段,并不是完全成熟的工具,在使用过程中需要克服一些深度学习本身带来的问题。例如,深度模型在实际训练中的参数优化问题。同时我们该选择什么样的深度模型来应对基于语义的图像检索问题,是我们首先需要考虑的。本文梳理了图像检索技术和深度学习技术的发展历程。在此基础上,提出了一种基于语义的图像检索框架。该框架中主要包含三部分:(1)特征提取网络,在本文中称为多层级的图像语义特征提取网络,框架通过该网络提取语义特征;(2)特征存储结构,它将提取出来的特征降维并转化成图像语义距离度量公式可以计算的格式;(3)图像语义距离度量公式,框架最终通过它实现图像语义距离的计算。多层级的图像语义特征提取网络是该框架的核心,它的性能直接影响着整个框架的最终精度,该网络能通过其层级结构分次对图像中的语义特征进行提取,独特的结构设计使得它可以挖掘图像中更深层的语义。特征存储结构将提取出来的图像语义特征转化成一种更低维更易计算的融合特征表,而图像语义距离度量公式则将通过融合特征表计算图像之间的语义距离,从而生成检索结果序列。在基于语义的图像检索框架中,多层级的图像语义特征提取网络可以被替换成其他分类网络,以灵活地应对不同的待检索图像。在多个数据集上的测试结果表明,与现有方法相比,本文框架能够更加准确地完成基于语义的图像检索工作。
[Abstract]:As a basic problem of computer vision, image retrieval has been analyzed and studied by many scholars. At the beginning of this century, people gradually realized the inherent "semantic gap" between low-level features and high-level semantic features, and began to involve semantic-based image retrieval with little effect. In recent years, depth learning technology has opened a new door for semantic image retrieval, which is beset by traditional artificial features. Compared with the traditional methods, the depth learning model has an amazing ability in mining deep-level features, and it is more likely to satisfy the semantic feature learning of images. However, deep learning itself is also in a rapid development stage, is not a fully mature tool, in the use of the process need to overcome some of the problems caused by the depth of learning itself. For example, the parameter optimization problem of depth model in practical training. At the same time, we should consider what depth model we should choose to deal with the semantic image retrieval problem. This paper reviews the development of image retrieval technology and depth learning technology. On this basis, a semantic-based image retrieval framework is proposed. The framework consists of three parts: (1) feature extraction network, which is called multi-level image semantic feature extraction network in this paper, is used to extract semantic feature; (2) feature storage structure, which reduces the dimension of the extracted feature and converts it into a format that can be calculated by the image semantic distance metric formula; (3) the image semantic distance measurement formula, by which the frame finally realizes the calculation of the image semantic distance. Multi-level image semantic feature extraction network is the core of the framework, and its performance directly affects the final accuracy of the whole framework. Unique structural design allows it to dig deeper semantics in images. The feature storage structure transforms the extracted image semantic features into a fusion feature table with lower dimension and easier to calculate, and the image semantic distance measurement formula calculates the semantic distance between images through the fusion feature table. Thus, the retrieval result sequence is generated. In the semantic-based image retrieval framework, the multi-level semantic feature extraction network can be replaced with other classification networks to flexibly deal with different images to be retrieved. The test results on multiple datasets show that the proposed framework is more accurate than the existing methods in image retrieval based on semantics.
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP183

【相似文献】

相关期刊论文 前10条

1 江士方,汪英姿;图像及图像检索应用前景的探讨[J];江苏工业学院学报(社会科学版);2003年04期

2 韩法旺;;基于云计算模式的图像检索研究[J];情报科学;2011年10期

3 何岩;;以计算机为基础的色彩图像检索方法与研究[J];计算机光盘软件与应用;2013年12期

4 郭海凤;李广水;仇彬任;;基于融合多特征的社会网上图像检索方法[J];计算机与现代化;2013年12期

5 柏正尧,周纪勤;基于复数矩不变性的图像检索方法研究[J];计算机应用;2000年10期

6 夏峰,张文龙;一种图像检索的新方法[J];计算机应用研究;2002年11期

7 邓诚强,冯刚;基于内容的多特征综合图像检索[J];计算机应用;2003年07期

8 斯白露,高文,卢汉清,曾炜,段立娟;基于感兴趣区域的图像检索方法[J];高技术通讯;2003年05期

9 刘怡,于沛;基于“知网”的新闻图像检索方法[J];河南师范大学学报(自然科学版);2003年02期

10 张荣,郑浩然,李金龙,王煦法;进化加速技术在图像检索中的应用[J];计算机工程与应用;2004年16期

相关会议论文 前10条

1 陈旭文;朱红丽;;一种高效的图像检索方法[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年

2 周向东;张亮;张琪;刘莉;殷慷;施伯乐;;一种新的图像检索相关反馈方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

3 陈世亮;李战怀;闫剑锋;;一种基于本体描述的空间语义图像检索方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

4 赵海英;彭宏;;基于最优近似反馈的图像检索[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年

5 许相莉;张利彪;于哲舟;周春光;;基于商空间粒度计算的图像检索[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年

6 李凌伟;周荣贵;刘怡;;基于概念的图像检索方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

7 杨关良;李忠杰;徐小杰;;基于代表色的图像检索方法研究[A];首届信息获取与处理学术会议论文集[C];2003年

8 彭瑜;乔奇峰;魏昆娟;;基于多示例学习的图像检索方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

9 胡敬;武港山;;基于语义特征的风景图像检索[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

10 许天兵;;一种基于语义分类的图像检索方法[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年

相关重要报纸文章 前6条

1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年

2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年

3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年

4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年

5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年

6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年

相关博士学位论文 前10条

1 崔超然;图像检索中自动标注、标签处理和重排序问题的研究[D];山东大学;2015年

2 杨迪;基于内容的分布式图像检索[D];北京邮电大学;2015年

3 张旭;网络图像检索关键技术研究[D];西安电子科技大学;2014年

4 吴梦麟;基于半监督学习的医学图像检索研究[D];南京理工大学;2015年

5 高毫林;基于哈希技术的图像检索研究[D];解放军信息工程大学;2014年

6 李清亮;图像检索中判别性增强研究[D];吉林大学;2016年

7 刘爽;多特征融合图像检索方法及其应用研究[D];哈尔滨理工大学;2016年

8 程航;密文JPEG图像检索研究[D];上海大学;2016年

9 李强;基于语义理解的图像检索研究[D];天津大学;2015年

10 刘少伟;面向用户意图的社会化图像检索[D];清华大学;2016年

相关硕士学位论文 前10条

1 陈修远;基于深度卷积神经网络的语义图像检索研究[D];电子科技大学;2017年

2 赵鸿;基于尺度不变局部特征的图像检索研究[D];华南理工大学;2015年

3 孙剑飞;基于图像索引的热点话题检索方法研究[D];兰州大学;2015年

4 章进洲;图像检索中的用户意图分析[D];南京理工大学;2015年

5 苗思杨;移动图像检索中的渐进式传输方式研究[D];大连海事大学;2015年

6 都业刚;基于显著性的移动图像检索[D];大连海事大学;2015年

7 王梦蕾;基于用户反馈和改进词袋模型的图像检索[D];南京理工大学;2015年

8 许鹏飞;基于草图的海量图像检索方法研究[D];浙江大学;2015年

9 冯进丽;基于BoF的图像检索与行为识别研究[D];山西大学;2015年

10 乔维强;基于低级特征和语义特征的医学图像检索[D];北京理工大学;2015年



本文编号:2390053

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2390053.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5814f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com