当前位置:主页 > 科技论文 > 自动化论文 >

基于潜在语义空间学习的跨模态检索研究

发布时间:2020-03-22 13:45
【摘要】:随着大数据时代的到来,多媒体数据呈现爆炸性增长趋势,单模态数据检索技术已不能满足人们对信息获取的需求,跨模态检索技术应时而生,且日益成为信息检索领域的主流,具有理论和实际应用意义。跨模态检索的基本内容是建立跨模态数据之间的配对关系,实现利用某一模态数据,检索具有近似语义的其它模态数据。本文主要研究如何为图像文本对建模,实现跨模态数据到潜在语义空间的转换,从而缩小跨模态数据之间的语义鸿沟,实现已知某一数据的文本模态能检索出相关的图像模态数据,或者已知图像模态检索出相关的文本模态数据。为了实现大规模高特征维度多媒体数据之间的相互检索,本文提出了如下三种基于潜在语义空间学习的跨模态检索技术:1.提出一种全相似性保留的哈希跨模态检索方法(All Similarity Preserving Cross-Modal Hashing,ASPCH)。该方法利用映射矩阵将图像和文本映射到潜在语义空间的同时利用标签的监督性质对模态内和模态间的语义表示进行相应的约束,来提高检索精度。其中模态内相似性的保留采用了K近邻的算法,在数据的局部几何结构上考虑了数据的联系,对于模态间则是考虑同一对象不同模态数据之间具有同一语义标签作为约束,以此来增强了语义表示之间的关联性。2.提出一种有监督鉴别跨模态哈希检索方法(Supervised Discriminative Hashing Cross-Modal Hashing,SDCH)。该算法在利用映射矩阵将图像和文本数据映射到潜在语义空间的同时将语义表示的学习转化为可分类问题,在保留模态间语义表示的一致性的同时,考虑约束语义表示在潜在语义空间中线性可分,使得语义表示更加具有鉴别力,从而提高跨模态检索精度。3.提出一种深度语义匹配跨模态检索算法(Deep Semantic Matching,DSM)。该方法通过微调AlexNet图像深度神经网络以及训练文本深度神经网络来分别提取图像和文本的顶层特征表示,将最终的类别概率贡献向量作为图像和文本的潜在语义特征表示,从而实现图像和文本在语义空间中的直接语义匹配。深度语义匹配利用深度学习的方法将底层特征顶层化,且在特征层面实现了跨模态数据之间的潜在语义相关性,实现图文互检。本文在Wiki单标签数据集以及NUS-WIDE多标签数据集上进行了图文互检实验,结果表明本文所提方法与其它前沿算法相比具有一定的优越性。
【图文】:

近邻算法


在监督学习下,如果给定么就可以根据这种已知条件[20],学,模型能够给出正确的输出结果。监器学习任务。训练数据是一套训练示入对象和期望输出值的数据组成。监生一个推断的功能,即能够用于映射且最简单的算法之一。它的思路是:在特征空间中最邻近)中的大多数属样本数据,分别表示为蓝色的小正则代表的是待分类的样本数据。换句于哪一个类别(或者使蓝色小正方形圆形分类。

哈希,潜在语义


图 2.2 哈希学习义空间学习跨模态检索算法都假设拥有相同语义标签的异构数据共享一个共潜在语义空间的子空间。在潜在语义空间中,来自不同模态的相接近[25],且近年来跨模态检索中考虑潜在语义空间思想得到了很态检索中潜在语义空间学习,是不依赖训练数据的,它旨在随机图像数据和文本数据映射到同构的潜在语义空间中,进行跨模态表示分别为1(1) d nX R 和2(2) d nX R ,假设对应的映射矩阵分别征向量的长度为k ,则有:(1)I IS = P X(2)S = P X
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.3;TP18

【相似文献】

相关期刊论文 前10条

1 张全;陆长德;余隋怀;于明玖;;基于多维情感语义空间的色彩表征方法[J];计算机辅助设计与图形学学报;2006年02期

2 张海波;张春艳;商书元;张颖;;男T恤图像情感语义空间研究[J];纺织科技进展;2016年06期

3 蔡碧霞;论语料库为基础的潜在语义空间内词义的量化分析[J];西安外国语学院学报;2005年03期

4 郑帅;齐向明;;基于多维语义空间的垃圾短信过滤算法[J];自动化技术与应用;2018年07期

5 倪宇超;张志军;;莱蒙托夫抒情诗语义空间中的“幸福”概念[J];绥化学院学报;2009年02期

6 张德;王子玮;张峰;;基于语义空间统一表征的视频多模态内容分析技术[J];电视技术;2017年Z2期

7 杨晓航;张晓林;;语义空间系统:语义Web技术的新应用——基于语义整合Web资源与服务[J];数字图书馆论坛;2006年05期

8 杨山;杨雅婷;温正阳;米成刚;;基于语义空间的抽取式单文档摘要方法[J];厦门大学学报(自然科学版);2019年02期

9 刘云峰,齐欢,代建民;潜在语义分析在中文信息处理中的应用[J];计算机工程与应用;2005年03期

10 段红伟;孟令奎;黄长青;李颖;李继园;;面向SPARQL查询的地理语义空间索引构建方法[J];测绘学报;2014年02期

相关会议论文 前4条

1 任海平;李伟忠;姚诚伟;;基于深度学习的智能写稿辅助服务设计[A];中国新闻技术工作者联合会2017年学术年会论文集(学术论文篇)[C];2017年

2 陈浩彬;汪凤炎;;基于智慧德才兼备理论的智慧分类研究[A];第十五届全国心理学学术会议论文摘要集[C];2012年

3 张海涛;张书亮;姜杰;顾燕;;基于EKR+的GML整体索引[A];第四届海峡两岸GIS发展研讨会暨中国GIS协会第十届年会论文集[C];2006年

4 乔百友;谢可心;王国仁;;TH-Ring:一种基于语义的结构化P2P网络[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

相关博士学位论文 前3条

1 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年

2 段红伟;地理语义查询关键技术研究[D];武汉大学;2013年

3 林梓佳;图像语义标注方法研究[D];清华大学;2015年

相关硕士学位论文 前10条

1 白雪峰;基于共享语义空间的无监督双语词典抽取[D];哈尔滨工业大学;2019年

2 朱治兰;基于潜在语义空间学习的跨模态检索研究[D];南京邮电大学;2019年

3 李志坚;社交网络多模态语义空间学习与国民安全突发事件检测研究[D];北京邮电大学;2019年

4 李虹磊;基于语义空间和神经网络的生物医学事件抽取[D];大连理工大学;2017年

5 陈磊;空间构型对语篇连贯的解释[D];东华大学;2012年

6 毕臣;基于语段的潜在语义分析技术研究[D];沈阳航空航天大学;2014年

7 郑伟;基于潜在语义索引的文本聚类技术研究[D];沈阳航空工业学院;2009年

8 郭东波;基于伪文档的潜在语义索引优化技术的研究[D];沈阳航空工业学院;2010年

9 周昊;个体 形象[D];中国美术学院;2015年

10 于霁月;基于产品语义学的服务机器人造型设计研究与应用[D];沈阳工业大学;2017年



本文编号:2595123

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2595123.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5733a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com