当前位置:主页 > 科技论文 > 自动化论文 >

基于深度语义学习的跨模态事件检索

发布时间:2020-08-06 23:02
【摘要】:近年来,由于互联网上诸如文档、图片、音频、视频等多模态数据的规模的急剧增长,跨模态检索这一课题吸引了越来越多的研究人员的注意。通常,不同模态的数据用于描述共同的事件或者主题。跨模态检索定义为:输入一种模态的数据作为查询,查询得到相关的另一种模态的数据。举例来说,用户输入一段新闻报道作为查询的输入,检索得到相关的图片或者视频。跨模态检索的应用范围十分宽广,包括:热点探测,个性化的推荐,搜索引擎等等。随着多模态数据的规模的不断增长,用户对感兴趣的信息进行高效的搜索开始变得困难。针对这一问题,研究人员提出了许多不同的解决方法。然而目前,大多数跨模态检索的技术,例如基于关键字的搜索,基于内容的搜索,在进行相似度搜索时的技术仅仅停留在单模态的层面。由于输入和得到的检索结果可以是不同的模态。其中的难点和挑战在于,如何度量不同模态的数据的内容相关度。本文的主要贡献为:1.本文将多媒体领域的跨模态检索以及社交媒体领域的事件检测两个课题相结合,提出了跨模态事件检索的课题。针对该课题,提出了一种学习深度语义空间的用于跨模态事件检索的方法。通过深度学习模型,提取图像和文本的语义特征,从而将异构的数据转换为同构的语义空间,在语义空间里,可以很方便地实现跨模态的检索。具体来说,对于图像数据,利用迁移学习的方法,采用经过ImageNet预训练的VGG网络,将来自ImageNet的先验知识迁移到目标数据集中。同时,通过最小化相同模态的源域数据以及目标域数据之间的最大均值差异,解决域矛盾的问题,使得迁移模型能够更好地匹配目标域中的图像数据的分布。对于文本数据,利用自然语言处理中提取文本特征的方法,将文本特征向量化之后,通过LSTM的非线性变换,转换为语义空间表示。最后,通过最小化正则化的语义损失,学习一个交互的深度语义空间模型,将异构的图像文本数据转换成同构的深度语义空间。在深度语义空间里,相关的图像文本对之间的余弦相似度得到了极大化,不相关的图像文本对之间的余弦相似度得到了极小化,可以直接用欧式距离,余弦距离等方法衡量向量之间的相似度。2.针对跨模态事件检索这一课题,本文收集了一个名为“Wiki-Flickr event dataset”的数据集。现有的跨模态检索数据集中,图像与文档是一一对应的。而在我们收集的数据集中,图像文本对是弱对齐的,不存在一一对应的关系。并且在该数据集的基础上,搭建了一个跨模态事件检索的系统。3.在公开的Pascal Sentences数据集和本文的Wiki-Flickr event数据集上进行的一系列实验表明,本文提出的基于深度语义空间的检索方法的性能,相比于传统的跨模态检索方法,有了很大的提升。相比于部分基于深度神经网络的方法,检索性能有了一定的提高。
【学位授予单位】:广东工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP18
【图文】:

多模态,现实生活,数据,事件


acebook 掌握着海量的数据,且仍在持续增长。这些数据以多模态的方式呈现,例如:像、文本、音频、视频等等。同时,多模态的数据规模的快速增长,加大了用户搜索兴趣的有价值的资讯的难度。多模态的数据具有异构型的特点。下图展示了多模态据的主要应用,包括热点检测,个性化的推荐系统以及跨模态的检索。

更新参数,函数近似,极小化,全连接


神经网络结构图示

神经元结构,下标,神经网络


神经元结构图示

【相似文献】

相关期刊论文 前10条

1 张全;陆长德;余隋怀;于明玖;;基于多维情感语义空间的色彩表征方法[J];计算机辅助设计与图形学学报;2006年02期

2 张海波;张春艳;商书元;张颖;;男T恤图像情感语义空间研究[J];纺织科技进展;2016年06期

3 蔡碧霞;论语料库为基础的潜在语义空间内词义的量化分析[J];西安外国语学院学报;2005年03期

4 郑帅;齐向明;;基于多维语义空间的垃圾短信过滤算法[J];自动化技术与应用;2018年07期

5 倪宇超;张志军;;莱蒙托夫抒情诗语义空间中的“幸福”概念[J];绥化学院学报;2009年02期

6 张德;王子玮;张峰;;基于语义空间统一表征的视频多模态内容分析技术[J];电视技术;2017年Z2期

7 杨晓航;张晓林;;语义空间系统:语义Web技术的新应用——基于语义整合Web资源与服务[J];数字图书馆论坛;2006年05期

8 杨山;杨雅婷;温正阳;米成刚;;基于语义空间的抽取式单文档摘要方法[J];厦门大学学报(自然科学版);2019年02期

9 刘云峰,齐欢,代建民;潜在语义分析在中文信息处理中的应用[J];计算机工程与应用;2005年03期

10 段红伟;孟令奎;黄长青;李颖;李继园;;面向SPARQL查询的地理语义空间索引构建方法[J];测绘学报;2014年02期

相关会议论文 前4条

1 任海平;李伟忠;姚诚伟;;基于深度学习的智能写稿辅助服务设计[A];中国新闻技术工作者联合会2017年学术年会论文集(学术论文篇)[C];2017年

2 陈浩彬;汪凤炎;;基于智慧德才兼备理论的智慧分类研究[A];第十五届全国心理学学术会议论文摘要集[C];2012年

3 张海涛;张书亮;姜杰;顾燕;;基于EKR+的GML整体索引[A];第四届海峡两岸GIS发展研讨会暨中国GIS协会第十届年会论文集[C];2006年

4 乔百友;谢可心;王国仁;;TH-Ring:一种基于语义的结构化P2P网络[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

相关博士学位论文 前3条

1 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年

2 段红伟;地理语义查询关键技术研究[D];武汉大学;2013年

3 林梓佳;图像语义标注方法研究[D];清华大学;2015年

相关硕士学位论文 前10条

1 白雪峰;基于共享语义空间的无监督双语词典抽取[D];哈尔滨工业大学;2019年

2 朱治兰;基于潜在语义空间学习的跨模态检索研究[D];南京邮电大学;2019年

3 司徒润威;基于深度语义学习的跨模态事件检索[D];广东工业大学;2019年

4 李志坚;社交网络多模态语义空间学习与国民安全突发事件检测研究[D];北京邮电大学;2019年

5 李虹磊;基于语义空间和神经网络的生物医学事件抽取[D];大连理工大学;2017年

6 陈磊;空间构型对语篇连贯的解释[D];东华大学;2012年

7 毕臣;基于语段的潜在语义分析技术研究[D];沈阳航空航天大学;2014年

8 郑伟;基于潜在语义索引的文本聚类技术研究[D];沈阳航空工业学院;2009年

9 郭东波;基于伪文档的潜在语义索引优化技术的研究[D];沈阳航空工业学院;2010年

10 周昊;个体 形象[D];中国美术学院;2015年



本文编号:2783093

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2783093.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ce36f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com