当前位置:主页 > 科技论文 > 软件论文 >

基于相关性分析的跨媒体检索

发布时间:2018-10-31 13:35
【摘要】:为了更加符合人脑对视觉、听觉等不同感官认知和感知外界信息的综合处理模式,使计算机能够模拟人脑对不同类型的多媒体数据进行认知、学习以及推理决策等一些信息加工的过程,于是“跨媒体”技术应运而生。随着互联网上多媒体数据的多样化和复杂化,实现跨媒体数据间准确有效地的相互检索变得愈发重要。跨媒体检索目前主要面临两方面的挑战:一方面,由于不同类型的多媒体数据在其底层特征表示上存在特征维数和属性上的不同,导致彼此之间存在异构性问题,即跨媒体异构鸿沟;另一方面,不同类型多媒体数据的底层特征与其高层语义间可能存在不一致性问题,即跨媒体语义鸿沟。为了解决这两个难题,需要针对跨媒体数据间存在的复杂关联关系进行深度挖掘与分析。本文对深度典型相关性分析进行结构改进,并将其应用在跨媒体数据上构建跨媒体相关性学习模型。深度典型相关性分析(DCCA)是一种将文本和图像对映射到公共潜在子空间进行相似性度量的深度方法。本文采用的方法对传统的DCCA进行结构改进,将网络中第一层隐藏层改造为线性投影损失层。线性投影层的训练是同非线性隐藏层的训练结合在一起的,以确保线性投影能够很好地与非线性处理阶段进行匹配,同时,能够从网络的输出端获取原始输入数据的更加抽象和更加准确的表示。然后通过跨媒体相关性分析挖掘出跨媒体数据间存在的复杂相关关系。在跨媒体检索的潜在空间中,语义上一致的图像和文本应该是彼此互相靠近的,但是CCA及其扩展方法仅仅最大化图像及对应文本之间的相关性并不能满足这个要求。因此,本文提出了一个基于深度相关性分析的跨媒体检索方法(CMSCR)。其通过自动探索语义标签对跨媒体相关性学习所得到的图像与文本最大相关子空间训练语义映射,从而得到图像语义空间及文本语义空间。然后通过相似性度量方法来计算文本和图像之间的相关性,从而实现跨媒体检索。本文最后对跨媒体系统的各个方面分别进行设计与介绍,对跨媒体检索的各种流行算法进行分类和整理。此外设计了一个跨媒体相关性检索引擎并通过示例展示其用户界面及检索结果。
[Abstract]:In order to accord with the integrated processing mode of human brain to different senses, such as vision and hearing, and to perceive the external information, the computer can simulate the human brain's cognition of different types of multimedia data. Learning and reasoning decision-making and other processes of information processing, so "cross-media" technology came into being. With the diversification and complexity of multimedia data on the Internet, it becomes more and more important to realize the accurate and effective cross-media data retrieval. Cross-media retrieval is currently facing two challenges: on the one hand, due to the difference of feature dimension and attribute in the underlying feature representation of different types of multimedia data, there is heterogeneity between them. That is, cross-media heterogeneity gap; On the other hand, there may be inconsistency between the underlying features of different types of multimedia data and their high-level semantics, that is, the cross-media semantic gap. In order to solve these two problems, it is necessary to deeply mine and analyze the complex association relationship between cross-media data. In this paper, the depth canonical correlation analysis is improved and applied to cross-media data to construct cross-media correlation learning model. Depth canonical correlation analysis (DCCA) is a depth method for measuring similarity between text and image pairs mapping to a common potential subspace. The method adopted in this paper improves the structure of the traditional DCCA and transforms the first hidden layer of the network into the linear projection loss layer. The training of the linear projection layer is combined with the training of the nonlinear hidden layer to ensure that the linear projection can be well matched with the nonlinear processing stage, at the same time, A more abstract and accurate representation of the original input data can be obtained from the output of the network. Then, the complex correlation between cross-media data is mined through cross-media correlation analysis. In the potential space of cross-media retrieval, semantically consistent images and texts should be close to each other, but CCA and its extension methods can not satisfy this requirement only by maximizing the correlation between images and corresponding texts. Therefore, a cross-media retrieval method based on depth correlation analysis (CMSCR).) is proposed in this paper. By automatically exploring semantic tags for cross-media relevance learning, the image and text maximal correlation subspace is trained to train the semantic mapping, thus the image semantic space and the text semantic space are obtained. Then the correlation between text and image is calculated by similarity measurement, and cross-media retrieval is realized. In the end, this paper designs and introduces each aspect of cross media system, classifies and arranges the popular algorithms of cross-media retrieval. In addition, a cross-media correlation retrieval engine is designed and its user interface and retrieval results are demonstrated by an example.
【学位授予单位】:中国科学院大学(中国科学院工程管理与信息技术学院)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 张静君;黄煜池;;网站与跨媒体战略[J];新经济;2001年11期

2 刘韬,帅彦茹;迎接跨媒体的艺术新生儿──“电脑剧”[J];电子出版;2001年07期

3 皮卓丁;数字出版与跨媒体解决方案[J];中国传媒科技;2005年07期

4 ;网络开辟跨媒体时代[J];广告人;2008年02期

5 王琪琦;李海燕;;试论“跨媒体”内容创作的策略[J];河北师范大学学报(哲学社会科学版);2011年05期

6 王琪琦;李海燕;;试论“跨媒体”内容创作的策略[J];重庆交通大学学报(社会科学版);2011年05期

7 周洋;;融媒时代跨媒体新闻编辑部的角色转变与实践探索[J];电视研究;2012年12期

8 黄丹俞;;跨媒体信息素养的概念、特点及对图书馆的意义[J];图书情报工作;2013年14期

9 罗建辉;;视听新媒体是电视剧传播的重要平台——在“2013‘飞天奖’创作与跨媒体传播高峰论坛”上的致辞[J];中国电视;2014年02期

10 陶然;跨媒体在国内的发展现状和前景──由新浪网并购阳光文化引起的思考[J];新闻知识;2002年02期

相关会议论文 前3条

1 郭之文;;跨媒体科学传播初探[A];第十一届中国科协年会第33分会场新媒体与科技传播研讨会论文集[C];2009年

2 黄敏;刘浩学;;不同光源照度对跨媒体颜色复制的影响研究[A];中国光学学会2010年光学大会论文集[C];2010年

3 李幸;;在欠发达地区建立跨媒体集团的启示——红河新闻传媒集团观察记[A];求异与趋同——中国影视文化主体性追求与现代性建构:中国高等院校影视学会第十二届年会暨第五届中国影视高层论坛文集[C];2008年

相关重要报纸文章 前10条

1 辛健;李颖:跨媒体的高级操盘手[N];中华工商时报;2001年

2 本报记者卢思宇;赛迪影视钟情跨媒体模式[N];中国经营报;2002年

3 李希光;媒体的融合与跨媒体记者[N];中华新闻报;2001年

4 国金证券 毛峥嵘 唐建伟;博瑞传播 跨媒体产业布局日渐清晰[N];中国证券报;2009年

5 克里斯托夫·合洛瓦提Christoph Holowaty 德英GamesIndustry.biz网站主编;跨媒体故事讲述[N];中国图书商报;2012年

6 本报记者 冰萧;跨媒体的畅想[N];中国计算机报;2001年

7 记者 虞宝竹;跨媒体、跨区域 合力打造新媒体[N];中华新闻报;2007年

8 毕磊;由“迷失”现象探析跨媒体大传媒运作[N];中国新闻出版报;2006年

9 本报记者 裴秋菊;跨媒体传媒帝国如何形成[N];中国文化报;2014年

10 李明;佛山市新闻中心正式投入使用[N];中华新闻报;2007年

相关博士学位论文 前2条

1 张磊;跨媒体语义共享子空间学习理论与方法研究[D];北京交通大学;2015年

2 张鸿;基于相关性挖掘的跨媒体检索研究[D];浙江大学;2007年

相关硕士学位论文 前10条

1 孟媛媛;跨媒体热点追踪系统的研究与实现[D];哈尔滨工业大学;2015年

2 杨涛;基于近邻可逆性的跨媒体检索研究[D];北京交通大学;2016年

3 陈婧琳;基于特征学习和关联学习的在线商品跨媒体检索研究[D];华东交通大学;2016年

4 邹辉;基于深度学习与中心相关性度量算法的跨媒体检索方法研究[D];华侨大学;2016年

5 王甜甜;《秦时明月》的跨媒体叙事研究[D];西华师范大学;2016年

6 王烨;基于隐藏层语义关联的跨媒体检索方法研究[D];华中科技大学;2015年

7 王述;基于相关性分析的跨媒体检索[D];中国科学院大学(中国科学院工程管理与信息技术学院);2017年

8 蒋益秀;新闻信息的跨媒体传播研究[D];中国社会科学院研究生院;2002年

9 刘凯;基于语义的跨媒体一致性研究[D];北京交通大学;2015年

10 侯晓文;从使用与满足理论探析传统杂志与微博的跨媒体合作[D];山东师范大学;2013年



本文编号:2302386

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2302386.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2837d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com