面向知识图谱补全的嵌入模型研究
发布时间:2020-11-22 05:39
随着大数据时代的到来,知识的存储与表示变得尤为重要。知识图谱是知识表示最有效的方式之一,被广泛的应用于智能搜索、智能问答等智能化应用。虽然,现有知识图谱的规模已经十分庞大,但其距离达到知识的完备状态依旧十分遥远。知识图谱的完备程度将直接影响智能化应用的性能好坏。为此,知识图谱补全技术备受关注,已经成为当前的一个研究热点。知识图谱嵌入旨在利用连续的、稠密的、低维的向量来表示知识图谱中的实体和关系,以便使用低维向量进行知识的推理和补全。近年来,基于翻译的模型表现出强大的可行性和鲁棒性,在知识图谱补全任务中实现了最先进的性能。但是现有翻译模型仍存在知识表示不够精确、负例三元组质量较低等不足,为了克服这些不足本文提出了MvTransE与TransE-SNS模型。本文主要研究内容如下:(1)本文提出了一种多视角学习的嵌入模型MvTransE。该模型先从实体的语义和结构角度生成多个平行子图。然后将原始的知识图谱和子图分别嵌入到全局视角空间和局部视角空间。最后利用多视角融合策略整合关系事实的多视角表示。MvTransE解决了现有模型的两个不足之处。第一,TransE、TransH等模型侧重于从全局出发,学习关系事实的全局表示,这样不能区别地学习各种类型的事实。特别是,它造成实体和关系在向量空间中的拥塞,从而降低了实体和关系向量的表示精度。第二,puTransE采用多个平行空间来学习局部事实,它损害了原始知识图谱的全局事实,从而降低了简单关系事实的学习能力。大量实验结果表明,MvTransE取得了最先进的性能。(2)本文提出了一种相似性负采样策略用于生成高质量的负例三元组。该策略先通过K-Means聚类算法将所有实体划分为多个簇。然后从正例三元组中头实体所在的簇中选择一个实体替换头实体,并以类似的方法替换尾实体。我们将相似性负采样策略与TransE相结合得到TransE-SNS。由于相似性负采样策略解决了TransE在训练中会生成大量的低质量负例三元组问题,提高了负例三元组的质量。大量实验结果表明,TransE-SNS的性能相较于TransE具有显著地提升。
【学位单位】:桂林电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.1;TP18
【部分图文】:
面向知识图谱补全的嵌入模型研究自从 2012 年 Google 正式提出知识图谱的概念并发布 GoogleKnowledgeGraph 以来,各大互联网企业也纷纷开始构建自己的知识图谱,如 MicrosoftSatori、阿里巴巴商品知识图谱和百度知心等。最初,Google 构建知识图谱的目的是为了提升搜索引擎搜索时的质量。在搜索时,Google 搜索引擎不仅会提供相关网页的链接列表,而且还会显示一些关于该搜索主题详细的结构化信息。如图 1-2 所示,当用户使用Google 搜索引擎搜索“马云”时,在搜索界面左侧提供了关于“马云”的网页链接列表,同时在搜索界面右侧显示了若干关于“马云”的客观事实信息。这些客观事实由搜索引擎通过知识图谱提供,从而实现用户在进行主题查询时不必导航至其他网页就可获取相关的主题信息。由此可见,知识图谱能够提高搜索引擎的用户体验和搜索质量。近年来,知识图谱已经不仅限于在搜索引擎中使用,同时还在智能问答系统、个性化推荐系统等智能化应用中产生巨大的价值。
【参考文献】
本文编号:2894213
【学位单位】:桂林电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.1;TP18
【部分图文】:
面向知识图谱补全的嵌入模型研究自从 2012 年 Google 正式提出知识图谱的概念并发布 GoogleKnowledgeGraph 以来,各大互联网企业也纷纷开始构建自己的知识图谱,如 MicrosoftSatori、阿里巴巴商品知识图谱和百度知心等。最初,Google 构建知识图谱的目的是为了提升搜索引擎搜索时的质量。在搜索时,Google 搜索引擎不仅会提供相关网页的链接列表,而且还会显示一些关于该搜索主题详细的结构化信息。如图 1-2 所示,当用户使用Google 搜索引擎搜索“马云”时,在搜索界面左侧提供了关于“马云”的网页链接列表,同时在搜索界面右侧显示了若干关于“马云”的客观事实信息。这些客观事实由搜索引擎通过知识图谱提供,从而实现用户在进行主题查询时不必导航至其他网页就可获取相关的主题信息。由此可见,知识图谱能够提高搜索引擎的用户体验和搜索质量。近年来,知识图谱已经不仅限于在搜索引擎中使用,同时还在智能问答系统、个性化推荐系统等智能化应用中产生巨大的价值。
【参考文献】
相关期刊论文 前1条
1 王元卓;靳小龙;程学旗;;网络大数据:现状与展望[J];计算机学报;2013年06期
相关博士学位论文 前2条
1 王桢;基于嵌入模型的知识图谱补全[D];中山大学;2017年
2 胡芳槐;基于多种数据源的中文知识图谱构建方法研究[D];华东理工大学;2015年
本文编号:2894213
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2894213.html