基于知识表示学习的知识图谱补全算法研究
发布时间:2021-02-20 15:29
知识图谱(Knowledge Graph)以三元组形式描述了客观世界中的概念、实体及其之间的关系,为自动理解海量信息提供了一种更好的表达形式。在使用大规模知识获取方法构建的知识图谱中通常存在大量关系缺失问题,如Freebase中71%的实体缺少出生地相关信息,Word Net和NELL也有着不同程度的词性、父母等关系缺失,缺失的关系会降低下游应用任务的精度。知识图谱补全是针对这一问题提出的自动补全方法,主要有基于符号推理、基于链路预测和基于知识表示学习的方法。基于符号推理的方法主要依赖于人工先验规则,推理效率低,无法适用于大型的知识图谱。基于链路预测的方法是利用网络拓扑结构,假设相似节点最有可能形成链接,但知识图谱中链接具有明确的语义信息,使得链接预测效果往往不理想。基于知识表示学习的补全是一种结合表示学习和链路预测的方法,采用数值推理替代符号推理,为大规模知识库的补全提供了一种高效的方式。论文针对知识表示学习补全方法中的计算效率和结构化信息考虑不足的问题,开展了三个方面的研究。(1)针对现有网络表示学习在链路预测中节点间关系考虑单一、计算效率低的问题,利用网络中节点之间的共同邻居的“...
【文章来源】:西南科技大学四川省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
知识图谱示例
1绪论3能力。这使得模型的参数数量也越来越多,过多的参数使得模型的计算效率随之下降,这时需要一种不增加模型参数就能提高模型补全能力的方法。同时目前的表示学习补全方法都使用一个评分函数(,,)来描述一个候选三元组(,,)成立的可能性,通过优化目标函数使得真实的三元组的得分(,,)大于不真实三元组的得分(,,′)或(′,,)。但大多数现有的知识表示学习算法都是使用一个简单的评分函数(,,)来描述(,,),很少考虑知识图谱的结构化信息,例如三元组的有向传递关系。1.2本文工作本文的关键研究内容为知识图谱关系(属性)缺失的问题,利用知识表示学习进行链路预测来对知识图谱中缺失的部分进行补全。知识图谱本身是一种网络(图)的数据结构,知识图谱补全任务对应于复杂网络中的链路预测,知识表示学习对应着网络表示学习,基于知识表示学习的知识图谱补全则对应着基于网络表示学习的链路预测问题;所以网络表示学习、链路预测与知识表示学习、知识图谱补全有着密不可分的关系。本文的工作也集中于这两个方面,图1-2展示了本文工作于研究内容之间关系。图1-2本文研究内容关系首先,本文针对传统复杂网络中图链路预测效率不高和现有的图表示学习没有针对链路预测问题进行单独考虑的问题,结合传统的链路预测方法和表示学习方法提出了基于资源分配的链路预测网络表示学习(NELP)。其次,对于现有的基于链路预测的知识表示学习补全方法来说,随着模型的效果的提升模型的复杂度也越来越高,本文通过知识图谱中的先验信息“关系类型约束”在不改变模型复杂度的前提下提升模型的效果提出了TransRT模型。最后,本文发现大多数现有的知识表示学习算法都是使用一个简单的评分函数
西南科技大学硕士学位论文62知识图谱补全研究综述2.1问题定义与评价标准2.1.1问题定义知识图谱补全是指在现有实体集合和关系集合的范围内为知识图谱添加实体与实体之间未明确标出的关系,形成一个新的三元组,同时保证新添加的三元组不与现有的三元组冲突。如图2-1的例子中,实线的边表示知识图谱中已经存在的实体之间的关系,而右边虚线的边则表示通过知识图谱补全为知识图谱中实体添加的关系;通过新添加的关系构成了新的三元组(叶莉,国籍,中国)、(叶莉,类型,人)等,从而使知识图谱的关系更加完整。图2-1知识图谱补全从图中可看出,知识图谱补全就是在知识图谱中新增加边,可看成知识图谱中的链路预测问题,但与传统的网络中链路预测的不同是由于知识图谱本身数据的不同造成的,因为知识图谱中的“边”是代表着明确含义的;对于预测的知识图谱中的边不单单是预测存不存在关系,还要预测出存在的是什么关系。所以其相较于网络上的链路预测更为复杂。知识图谱补全中常用的方法有基于符号推理、机器学习分类器链路预测和表示学习的方法,其评价方法也不同于传统的链路预测问题使用准确率来评价。在知识图谱补全中常用的排序作为指标,而其中常用的知识图谱数据集为WordNet和FreeBase两个知识库,下面将具体介绍数据集和评价标准。2.1.2数据集这里介绍在具体知识图谱补全中所用的数据,本章的使用共使用了来自两个知识库的5个数据集,数据集的具体信息如表2-1所示
【参考文献】:
期刊论文
[1]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
[2]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
本文编号:3042962
【文章来源】:西南科技大学四川省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
知识图谱示例
1绪论3能力。这使得模型的参数数量也越来越多,过多的参数使得模型的计算效率随之下降,这时需要一种不增加模型参数就能提高模型补全能力的方法。同时目前的表示学习补全方法都使用一个评分函数(,,)来描述一个候选三元组(,,)成立的可能性,通过优化目标函数使得真实的三元组的得分(,,)大于不真实三元组的得分(,,′)或(′,,)。但大多数现有的知识表示学习算法都是使用一个简单的评分函数(,,)来描述(,,),很少考虑知识图谱的结构化信息,例如三元组的有向传递关系。1.2本文工作本文的关键研究内容为知识图谱关系(属性)缺失的问题,利用知识表示学习进行链路预测来对知识图谱中缺失的部分进行补全。知识图谱本身是一种网络(图)的数据结构,知识图谱补全任务对应于复杂网络中的链路预测,知识表示学习对应着网络表示学习,基于知识表示学习的知识图谱补全则对应着基于网络表示学习的链路预测问题;所以网络表示学习、链路预测与知识表示学习、知识图谱补全有着密不可分的关系。本文的工作也集中于这两个方面,图1-2展示了本文工作于研究内容之间关系。图1-2本文研究内容关系首先,本文针对传统复杂网络中图链路预测效率不高和现有的图表示学习没有针对链路预测问题进行单独考虑的问题,结合传统的链路预测方法和表示学习方法提出了基于资源分配的链路预测网络表示学习(NELP)。其次,对于现有的基于链路预测的知识表示学习补全方法来说,随着模型的效果的提升模型的复杂度也越来越高,本文通过知识图谱中的先验信息“关系类型约束”在不改变模型复杂度的前提下提升模型的效果提出了TransRT模型。最后,本文发现大多数现有的知识表示学习算法都是使用一个简单的评分函数
西南科技大学硕士学位论文62知识图谱补全研究综述2.1问题定义与评价标准2.1.1问题定义知识图谱补全是指在现有实体集合和关系集合的范围内为知识图谱添加实体与实体之间未明确标出的关系,形成一个新的三元组,同时保证新添加的三元组不与现有的三元组冲突。如图2-1的例子中,实线的边表示知识图谱中已经存在的实体之间的关系,而右边虚线的边则表示通过知识图谱补全为知识图谱中实体添加的关系;通过新添加的关系构成了新的三元组(叶莉,国籍,中国)、(叶莉,类型,人)等,从而使知识图谱的关系更加完整。图2-1知识图谱补全从图中可看出,知识图谱补全就是在知识图谱中新增加边,可看成知识图谱中的链路预测问题,但与传统的网络中链路预测的不同是由于知识图谱本身数据的不同造成的,因为知识图谱中的“边”是代表着明确含义的;对于预测的知识图谱中的边不单单是预测存不存在关系,还要预测出存在的是什么关系。所以其相较于网络上的链路预测更为复杂。知识图谱补全中常用的方法有基于符号推理、机器学习分类器链路预测和表示学习的方法,其评价方法也不同于传统的链路预测问题使用准确率来评价。在知识图谱补全中常用的排序作为指标,而其中常用的知识图谱数据集为WordNet和FreeBase两个知识库,下面将具体介绍数据集和评价标准。2.1.2数据集这里介绍在具体知识图谱补全中所用的数据,本章的使用共使用了来自两个知识库的5个数据集,数据集的具体信息如表2-1所示
【参考文献】:
期刊论文
[1]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
[2]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
本文编号:3042962
本文链接:https://www.wllwen.com/kejilunwen/yysx/3042962.html