当前位置:主页 > 经济论文 > 电子商务论文 >

基于特征学习和关联学习的在线商品跨媒体检索研究

发布时间:2018-01-20 04:01

  本文关键词: 跨媒体检索 在线商品 特征学习 关联学习 典型相关性分析 语义相关匹配 出处:《华东交通大学》2016年硕士论文 论文类型:学位论文


【摘要】:现有电子商务平台仅提供基于关键字匹配的单模态检索,检索准确率偏低,用户常常无法准确地找到所需商品,其检索交互体验较差。跨媒体检索基于多媒体数据之间的语义相关性实现异构媒体之间的直接检索,它能有效提高信息检索的查准率,是单模态检索的有益补充。本文充分考虑商品图像及其文本描述的自身特点,将跨媒体检索模型和方法应用于面向电子商务平台的在线商品检索,主要从特征学习和关联学习两个角度展开研究工作:一、传统文本特征提取方式未考虑关键特征词在文本中出现位置的统计信息,为了突出关键特征词权重,抑制文本噪声干扰,引入Tag-rank模型,根据特征词在文本中的位置统计分布计算其绝对排序和相对排序权重,增强文本特征判别性,最终改善跨媒体检索性能。实验结果表明,在文本检索图像中,绝对排序类模型和相对排序类模型检索性能平均提升4.99%和6.58%;在图像检索文本中,若合理选取图像特征(如GIST特征),也能有效提升检索性能。此外,本文设计的绝对排序类模型和相对排序类模型的输出结果后融合的策略能进一步改善跨媒体检索性能。二、图像和文本之间存在严重的内容鸿沟和语义鸿沟,基于典型相关性分析分别建立核典型相关模型和语义相关匹配模型。核典型相关模型将核函数引入典型相关性分析,学习图像和文本之间隐藏的非线性关联,从而缩小内容鸿沟并且增强两者之间的关联,改善跨媒体检索性能。语义相关匹配模型将典型相关空间的图像和文本特征映射到高层语义空间,并学习两者间的语义关联,以缩小两者之间的语义鸿沟,提高跨媒体检索性能。实验结果表明,基于线性核、高斯核和多项式核的核典型相关模型均能够有效地提升跨媒体检索性能,其中基于高斯核的核典型相关模型平均提升2.37%,效果最显著;语义相关匹配模型能有效地改善文本检索图像性能,平均提高3.82%,在图像检索文本中,若合理地选择图像特征(如SIFT特征),也能改善检索性能。
[Abstract]:The existing e-commerce platform only provides keyword matching based on single mode retrieval, the retrieval accuracy is low, users often can not find the desired goods accurately. Cross-media retrieval based on semantic correlation between multimedia data to achieve direct retrieval between heterogeneous media, it can effectively improve the accuracy of information retrieval. This paper fully considers the characteristics of commodity image and its text description, and applies cross-media retrieval model and method to online commodity retrieval based on e-commerce platform. The main research work is from two aspects of feature learning and association learning: first, the traditional text feature extraction method does not consider the statistical information of the location of key feature words in the text, in order to highlight the weight of key feature words. In order to reduce text noise interference, Tag-rank model is introduced to calculate the absolute ranking and relative sorting weights according to the statistical distribution of the location of feature words in the text, so as to enhance the text feature discrimination. Finally, the performance of cross-media retrieval is improved. The experimental results show that in text retrieval, the retrieval performance of absolute sort model and relative sort class model are improved by 4.99% and 6.58 on average. In the image retrieval text, if the image features (such as GIST features) are properly selected, the retrieval performance can also be effectively improved. The fusion strategy of absolute sort class model and relative sort class model designed in this paper can further improve the performance of cross-media retrieval. Secondly, there is a serious content gap and semantic gap between image and text. Kernel canonical correlation model and semantic correlation matching model are established based on canonical correlation analysis. Kernel canonical correlation model introduces kernel function into canonical correlation analysis to learn the hidden nonlinear correlation between image and text. In order to reduce the content gap and enhance the correlation between the two improve cross-media retrieval performance. Semantic correlation matching model maps the image and text features of the typical correlation space to the high-level semantic space. In order to reduce the semantic gap between the two and improve the performance of cross-media retrieval, the experimental results show that, based on linear kernel. The kernel canonical correlation model of Gao Si kernel and polynomial kernel can effectively improve the performance of cross-media retrieval. Semantic correlation matching model can effectively improve the image performance of text retrieval, with an average increase of 3.82%. In image retrieval, image features (such as SIFT features) should be reasonably selected. It also improves retrieval performance.
【学位授予单位】:华东交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 刘韬,帅彦茹;迎接跨媒体的艺术新生儿──“电脑剧”[J];电子出版;2001年07期

2 皮卓丁;数字出版与跨媒体解决方案[J];中国传媒科技;2005年07期

3 ;网络开辟跨媒体时代[J];广告人;2008年02期

4 王琪琦;李海燕;;试论“跨媒体”内容创作的策略[J];河北师范大学学报(哲学社会科学版);2011年05期

5 王琪琦;李海燕;;试论“跨媒体”内容创作的策略[J];重庆交通大学学报(社会科学版);2011年05期

6 周洋;;融媒时代跨媒体新闻编辑部的角色转变与实践探索[J];电视研究;2012年12期

7 黄丹俞;;跨媒体信息素养的概念、特点及对图书馆的意义[J];图书情报工作;2013年14期

8 罗建辉;;视听新媒体是电视剧传播的重要平台——在“2013‘飞天奖’创作与跨媒体传播高峰论坛”上的致辞[J];中国电视;2014年02期

9 陶然;跨媒体在国内的发展现状和前景──由新浪网并购阳光文化引起的思考[J];新闻知识;2002年02期

10 王炎龙;关于“跨媒体传播”问题的探讨[J];新闻知识;2002年02期

相关会议论文 前3条

1 郭之文;;跨媒体科学传播初探[A];第十一届中国科协年会第33分会场新媒体与科技传播研讨会论文集[C];2009年

2 黄敏;刘浩学;;不同光源照度对跨媒体颜色复制的影响研究[A];中国光学学会2010年光学大会论文集[C];2010年

3 李幸;;在欠发达地区建立跨媒体集团的启示——红河新闻传媒集团观察记[A];求异与趋同——中国影视文化主体性追求与现代性建构:中国高等院校影视学会第十二届年会暨第五届中国影视高层论坛文集[C];2008年

相关重要报纸文章 前10条

1 辛健;李颖:跨媒体的高级操盘手[N];中华工商时报;2001年

2 本报记者卢思宇;赛迪影视钟情跨媒体模式[N];中国经营报;2002年

3 李希光;媒体的融合与跨媒体记者[N];中华新闻报;2001年

4 国金证券 毛峥嵘 唐建伟;博瑞传播 跨媒体产业布局日渐清晰[N];中国证券报;2009年

5 克里斯托夫·合洛瓦提Christoph Holowaty 德英GamesIndustry.biz网站主编;跨媒体故事讲述[N];中国图书商报;2012年

6 本报记者 冰萧;跨媒体的畅想[N];中国计算机报;2001年

7 记者 虞宝竹;跨媒体、跨区域 合力打造新媒体[N];中华新闻报;2007年

8 毕磊;由“迷失”现象探析跨媒体大传媒运作[N];中国新闻出版报;2006年

9 本报记者 裴秋菊;跨媒体传媒帝国如何形成[N];中国文化报;2014年

10 李明;佛山市新闻中心正式投入使用[N];中华新闻报;2007年

相关博士学位论文 前2条

1 张磊;跨媒体语义共享子空间学习理论与方法研究[D];北京交通大学;2015年

2 张鸿;基于相关性挖掘的跨媒体检索研究[D];浙江大学;2007年

相关硕士学位论文 前7条

1 孟媛媛;跨媒体热点追踪系统的研究与实现[D];哈尔滨工业大学;2015年

2 杨涛;基于近邻可逆性的跨媒体检索研究[D];北京交通大学;2016年

3 陈婧琳;基于特征学习和关联学习的在线商品跨媒体检索研究[D];华东交通大学;2016年

4 蒋益秀;新闻信息的跨媒体传播研究[D];中国社会科学院研究生院;2002年

5 刘凯;基于语义的跨媒体一致性研究[D];北京交通大学;2015年

6 侯晓文;从使用与满足理论探析传统杂志与微博的跨媒体合作[D];山东师范大学;2013年

7 张凯;基于跨媒体检索的网络报警的研究与实现[D];吉林大学;2012年



本文编号:1446763

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1446763.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e5890***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com