当前位置:主页 > 科技论文 > 自动化论文 >

结合视觉注意机制与递归神经网络的图像检索

发布时间:2019-05-13 10:36
【摘要】:目的图像检索是计算机视觉的一项重要任务。图像检索的关键是图像的内容描述,复杂图像的内容描述很具有挑战性。传统的方法用固定长度的向量描述图像内容,为此提出一种变长序列描述模型,目的是丰富特征编码的信息表达能力,提高检索精度。方法本文提出序列描述模型,用可变长度特征序列描述图像。序列描述模型首先用CNN(convolutional neural network)提取底层特征,然后用中间层LSTM(long short-term memory)产生局部特征的相关性表示,最后用视觉注意LSTM(attention LSTM)产生一组向量描述一幅图像。通过匈牙利算法计算图像之间的相似性完成图像检索任务。模型采用标签级别的triplet loss函数进行端对端的训练。结果在MIRFLICKR-25K和NUS-WIDE数据集上进行图像检索实验,并和相关算法进行比较。相对于其他方法,本文模型检索精度提高了5 12个百分点。相对于定长的图像描述方式,本文模型在多标签数据集上能够显著改善检索效果。结论本文提出了新的图像序列描述模型,可以显著改善检索效果,适用于多标签图像的检索任务。
[Abstract]:Objective Image retrieval is an important task of computer vision. The key of image retrieval is the content description of image, and the content description of complex image is very challenging. The traditional method describes the image content with a fixed length vector. Therefore, a variable length sequence description model is proposed in order to enrich the information expression ability of feature coding and improve the retrieval accuracy. Methods in this paper, a sequence description model is proposed, and a variable length feature sequence is used to describe the image. The sequence description model first uses CNN (convolutional neural network) to extract the underlying features, and then uses the intermediate layer LSTM (long short-term memory to generate the correlation representation of local features. Finally, the visual attention LSTM (attention LSTM) is used to generate a set of vectors to describe an image. The Hungarian algorithm is used to calculate the similarity between images to complete the task of image retrieval. The model uses label level triplet loss function for end-to-end training. Results Image retrieval experiments were carried out on MIRFLICKR-25K and NUS-WIDE datasets and compared with related algorithms. Compared with other methods, the retrieval accuracy of this model is improved by 512 percentage points. Compared with the fixed-length image description, this model can significantly improve the retrieval effect on multi-label datasets. Conclusion A new image sequence description model is proposed in this paper, which can significantly improve the retrieval effect and is suitable for multi-label image retrieval.
【作者单位】: 国防科学技术大学计算机学院;
【基金】:国家自然科学基金项目(U1435219)~~
【分类号】:TP391.41;TP183

【相似文献】

相关期刊论文 前10条

1 韩法旺;;基于云计算模式的图像检索研究[J];情报科学;2011年10期

2 何岩;;以计算机为基础的色彩图像检索方法与研究[J];计算机光盘软件与应用;2013年12期

3 郭海凤;李广水;仇彬任;;基于融合多特征的社会网上图像检索方法[J];计算机与现代化;2013年12期

4 柏正尧,周纪勤;基于复数矩不变性的图像检索方法研究[J];计算机应用;2000年10期

5 夏峰,张文龙;一种图像检索的新方法[J];计算机应用研究;2002年11期

6 邓诚强,冯刚;基于内容的多特征综合图像检索[J];计算机应用;2003年07期

7 斯白露,高文,卢汉清,曾炜,段立娟;基于感兴趣区域的图像检索方法[J];高技术通讯;2003年05期

8 刘怡,于沛;基于“知网”的新闻图像检索方法[J];河南师范大学学报(自然科学版);2003年02期

9 张荣,郑浩然,李金龙,王煦法;进化加速技术在图像检索中的应用[J];计算机工程与应用;2004年16期

10 黄德才,胡嘉,郑月锋;交互式图像检索中相关反馈进展研究[J];计算机应用研究;2005年09期

相关会议论文 前10条

1 陈旭文;朱红丽;;一种高效的图像检索方法[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年

2 周向东;张亮;张琪;刘莉;殷慷;施伯乐;;一种新的图像检索相关反馈方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

3 陈世亮;李战怀;闫剑锋;;一种基于本体描述的空间语义图像检索方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

4 赵海英;彭宏;;基于最优近似反馈的图像检索[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年

5 许相莉;张利彪;于哲舟;周春光;;基于商空间粒度计算的图像检索[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年

6 李凌伟;周荣贵;刘怡;;基于概念的图像检索方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

7 杨关良;李忠杰;徐小杰;;基于代表色的图像检索方法研究[A];首届信息获取与处理学术会议论文集[C];2003年

8 彭瑜;乔奇峰;魏昆娟;;基于多示例学习的图像检索方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

9 胡敬;武港山;;基于语义特征的风景图像检索[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

10 许天兵;;一种基于语义分类的图像检索方法[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年

相关博士学位论文 前10条

1 崔超然;图像检索中自动标注、标签处理和重排序问题的研究[D];山东大学;2015年

2 杨迪;基于内容的分布式图像检索[D];北京邮电大学;2015年

3 张旭;网络图像检索关键技术研究[D];西安电子科技大学;2014年

4 吴梦麟;基于半监督学习的医学图像检索研究[D];南京理工大学;2015年

5 高毫林;基于哈希技术的图像检索研究[D];解放军信息工程大学;2014年

6 李清亮;图像检索中判别性增强研究[D];吉林大学;2016年

7 刘爽;多特征融合图像检索方法及其应用研究[D];哈尔滨理工大学;2016年

8 程航;密文JPEG图像检索研究[D];上海大学;2016年

9 李展;基于多示例学习的图像检索与推荐相关算法研究[D];西北大学;2012年

10 郭丽;基于内容的商标图像检索研究[D];南京理工大学;2003年

相关硕士学位论文 前10条

1 赵鸿;基于尺度不变局部特征的图像检索研究[D];华南理工大学;2015年

2 孙剑飞;基于图像索引的热点话题检索方法研究[D];兰州大学;2015年

3 章进洲;图像检索中的用户意图分析[D];南京理工大学;2015年

4 苗思杨;移动图像检索中的渐进式传输方式研究[D];大连海事大学;2015年

5 都业刚;基于显著性的移动图像检索[D];大连海事大学;2015年

6 王梦蕾;基于用户反馈和改进词袋模型的图像检索[D];南京理工大学;2015年

7 许鹏飞;基于草图的海量图像检索方法研究[D];浙江大学;2015年

8 冯进丽;基于BoF的图像检索与行为识别研究[D];山西大学;2015年

9 乔维强;基于低级特征和语义特征的医学图像检索[D];北京理工大学;2015年

10 蒋国宝;基于内容的概念建模和图像检索重排序[D];复旦大学;2014年



本文编号:2475811

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2475811.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6873f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com