基于哈希学习的跨模态检索技术研究
发布时间:2022-01-20 06:53
人工智能技术的发展已经越来越成熟,许多基于人工智能技术的高科技公司如雨后春笋般涌现,甚至有不少企业已经生产出了能够改变我们日常生活的人工智能产品。而人工智能技术可以取得如此令人印象深刻的成果,却并非一蹴而就。自1956年人工智能技术诞生至今,已经经历了多次的爆发期与寒冬期,而这次人工智能技术的爆发更加来势汹汹,因为其与之前几次的爆发期相比,具有一个鲜明的特点——以大数据为基础。大数据不仅仅是因其数据量大,更重要的是其数据种类具有多样性,且数据的价值密度较低。我们每天都会产生和接收各种信息,而这些信息都会被记录下来,然后通过各种人工智能技术来分析我们的日常行为、生活习性,以便为我们的生活提供各种便利性的服务。在海量的多媒体数据之中,有些数据并不是相互独立的,它们很可能是对同一事物的不同表现方式,在语义上具有一定的相似性。如何从这些不同类型的数据中检索到需要的数据逐渐已经成为人们的迫切需求,也得到了学术界的广泛关注,这就是跨模态检索。跨模态检索的根本目的是寻找不同模态间具有相似性的样本,是以一种模态的数据作为输入,在数据库中检索出在语义上具有相似性的另一种模态的数据的方法。而哈希方法因为其...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
单模态检索示意图
哈尔滨工业大学工学硕士学位论文除了文本检索外,最具用的就是基于图像的单模态检索,即图像检索。早在 20世纪 70 年代末期,就已经有学者开始从事图像检索的相关研究工作,经过多年的技术发展,目前的图像检索技术主要可以分为两种[57]:(1)基于文本的图像检索[25]方法。该方法首先应用于图像检索研究,其主要思想是将文本检索中取得一定成果的技术移植到图像检索中。首先由人工的方式对大量的图片进行类别标注,形成一个图像数据库,而这些图像数据库是以人工标注的类别作为索引的。检索时通过输入的文本与索引进行对比,可以迅速找到相同类别的图像。该方法实质是将图片通过人工标注的方式转换为类别标签,再通过类别标签进行文本查询,简单快捷。但是,该方法显然存在先天的不足。因为该方法的本质是一个劳动力密集形工作,因为每个劳动力每天的工作量是有上限的,随着图片数量的不断增长,只能通过增加劳动力的方式来完成工作。而且,图片类别标注的好坏会受到标注者的主观意愿的影响,不存在一个可以量化的标准,如图 1-2所示,两张图片都可能被标注为“高楼”、“天空”,但其侧重点显然不同,注定了无法对每张图片都进行准确的标注[4],会对最后的搜索结果产生巨大的影响。
哈尔滨工业大学工学硕士学位论文1.2.2 跨模态检索跨模态检索的适用范围比单模态检索要广,其以任一种模态的数据作为被查询的示例,从海量的多媒体数据库中查询与之具有语义相关性的其他模态的数据,其示意图如图 1-3 所示。跨模态检索本质是跨越多种模态信息间描述方式上的鸿沟,通过子空间学习(Subspace Learning),将它们映射到同一维度空间上进行度量,以此把语义表达上具有相似性的不同模态间的数据联系起来,达到可以只用一种模态的数据就检索出其他模态数据的目的。
【参考文献】:
期刊论文
[1]基于改进的局部敏感哈希算法实现图像型垃圾邮件过滤[J]. 曹玉东,刘艳洋,贾旭,王冬霞. 计算机应用研究. 2016(06)
[2]大数据哈希学习:现状与趋势[J]. 李武军,周志华. 科学通报. 2015(Z1)
[3]综合纹理统计模型与全局主颜色的图像检索方法[J]. 陈慧婷,覃团发,唐振华,常侃. 北京邮电大学学报. 2011(S1)
博士论文
[1]基于图像哈希的大规模图像检索方法研究[D]. 付海燕.大连理工大学 2014
硕士论文
[1]基于P-稳态分布和空间球面网格的位置敏感哈希算法[D]. 陈翔.哈尔滨工业大学 2015
本文编号:3598370
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
单模态检索示意图
哈尔滨工业大学工学硕士学位论文除了文本检索外,最具用的就是基于图像的单模态检索,即图像检索。早在 20世纪 70 年代末期,就已经有学者开始从事图像检索的相关研究工作,经过多年的技术发展,目前的图像检索技术主要可以分为两种[57]:(1)基于文本的图像检索[25]方法。该方法首先应用于图像检索研究,其主要思想是将文本检索中取得一定成果的技术移植到图像检索中。首先由人工的方式对大量的图片进行类别标注,形成一个图像数据库,而这些图像数据库是以人工标注的类别作为索引的。检索时通过输入的文本与索引进行对比,可以迅速找到相同类别的图像。该方法实质是将图片通过人工标注的方式转换为类别标签,再通过类别标签进行文本查询,简单快捷。但是,该方法显然存在先天的不足。因为该方法的本质是一个劳动力密集形工作,因为每个劳动力每天的工作量是有上限的,随着图片数量的不断增长,只能通过增加劳动力的方式来完成工作。而且,图片类别标注的好坏会受到标注者的主观意愿的影响,不存在一个可以量化的标准,如图 1-2所示,两张图片都可能被标注为“高楼”、“天空”,但其侧重点显然不同,注定了无法对每张图片都进行准确的标注[4],会对最后的搜索结果产生巨大的影响。
哈尔滨工业大学工学硕士学位论文1.2.2 跨模态检索跨模态检索的适用范围比单模态检索要广,其以任一种模态的数据作为被查询的示例,从海量的多媒体数据库中查询与之具有语义相关性的其他模态的数据,其示意图如图 1-3 所示。跨模态检索本质是跨越多种模态信息间描述方式上的鸿沟,通过子空间学习(Subspace Learning),将它们映射到同一维度空间上进行度量,以此把语义表达上具有相似性的不同模态间的数据联系起来,达到可以只用一种模态的数据就检索出其他模态数据的目的。
【参考文献】:
期刊论文
[1]基于改进的局部敏感哈希算法实现图像型垃圾邮件过滤[J]. 曹玉东,刘艳洋,贾旭,王冬霞. 计算机应用研究. 2016(06)
[2]大数据哈希学习:现状与趋势[J]. 李武军,周志华. 科学通报. 2015(Z1)
[3]综合纹理统计模型与全局主颜色的图像检索方法[J]. 陈慧婷,覃团发,唐振华,常侃. 北京邮电大学学报. 2011(S1)
博士论文
[1]基于图像哈希的大规模图像检索方法研究[D]. 付海燕.大连理工大学 2014
硕士论文
[1]基于P-稳态分布和空间球面网格的位置敏感哈希算法[D]. 陈翔.哈尔滨工业大学 2015
本文编号:3598370
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3598370.html
最近更新
教材专著