面向问答系统的知识图谱推理算法的研究与实现
发布时间:2021-03-07 23:41
知识图谱由于其具有的知识高度结构化、应用范围广等优点获得了众多研究人员的关注。基于知识图谱的问答系统作为知识图谱的一大典型应用,目前仍然存在着无法有效表示和利用知识的问题。针对这一问题,本文开展了对知识表示和基于知识图谱的问答推理的研究,并实现了基于实体和关系描述的知识嵌入模型和基于事实记忆和知识图谱的问答模型。其中,基于实体和关系描述的知识嵌入模型用于改善知识的向量表示效果,基于事实记忆和知识图谱的问答模型则用于在知识图谱上推理出问题答案。具体来说,本文的主要研究工作如下:(1)提出并实现了基于实体和关系描述的知识嵌入模型。当前的大多数知识嵌入模型都存在着在三元组的语义信息这一方面考虑过少的问题,针对于这一问题,本文提出了基于实体和关系描述的知识嵌入模型。在该模型中,不仅改进了传统的DKRL模型和TransD模型,在获取实体和关系语义时,也采取了结合注意力机制和卷积神经网络的实体描述嵌入模型和层次化关系语义嵌入模型这两种新方法。实验证明,本模型相比TransE、TransD和DKRL等基线模型,在链接预测中使用bern采样时平均排名达到了最优,且此时的hits@10也达到了最优的77...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
TransE模型
第二章相关研究工作图2-1TransE模型图2-2TransH模型2.1.1复杂关系建模首先,给出复杂关系的定义:给定r0,对于所有的三元组(h,r0,t)∈S,倘若这样的三元组个数大于1,则称这样的关系是复杂关系。复杂关系可以根据该关系两端的头实体和尾实体的数目进一步划分为1-N,N-N和N-1三种类型。上文提到了TransE难以处理复杂关系,这是因为在TransE简单的约束下,对于复杂关系,容易出现不同意义实体的表示向量趋于相同的情况。例如,对于(成都,位于,四川省),(电子科大,位于,四川省)这样的两个三元组,利用TransE来进行知识嵌入的时候,由于需要满足u成都+u位于≈u四川省和u电子科大+u位于≈u四川省这两个条件,故而容易看出,“成都”和“四川时的向量在训练后会趋于相同。针对于TransE模型无法恰当地处理复杂关系的问题,研究者提出了大量的模型。本文主要从中选取了六个最经典的模型来进行介绍。(1)TransH模型为了能对复杂关系进行处理,对于每一个关系r,TransH使用两个向量来进行表示,一个是平移向量lr,一个是法向量wr;同时对于每一个三元组(h,r,t),TransH首先分别将头实体h对应的向量uh和尾实体t对应的向量ut沿着法向量wr投影到关系r对应的超平面上,得到uh⊥和ut⊥,然后再让投影向量uh⊥、ut⊥和lr满足TransE的约束条件,即uh⊥+lr≈ut⊥。其中,uh⊥的计算过程为uh⊥=uhwTruhwr.(2-3)ut⊥的计算过程为ut⊥=utwTrutwr.(2-4)图2-2则是TransH模型的示意图。相比TransE模型,由于TransH多了头实7
电子科技大学硕士学位论文体h、尾实体t在关系超平面进行投影这一步,所以每个实体在不同关系平面上都有不同的向量表示,实体的表示更加灵活,这使得TransH能较好地对复杂关系的情况进行处理。(2)TransR/CTransR模型虽然TransH能够对复杂关系进行一定的正确表示,但是由于其依旧认为实体和关系表示需要处于同一空间,这一点大大减弱了TransH的表示能力。针对于这一点,WangZ等提出了TransR模型。TransR模型认为,实体和关系不应该处于同一个空间,因为实体包含了不同的属性信息,而不同的关系关注着实体的不同属性。故而对于每个三元组(h,r,t),我们要先将头实体h和尾实体t映射到关系r所在的关系空间中,然后再建立头实体h到尾实体t的翻译关系。TransR模型如图2-3所示。图2-3TransR模型上图中,hr是头实体h在关系r的关系空间中的投影(对应的投影向量表示为uhr),tr则是尾实体t在关系r的关系空间中的投影(对应的投影向量表示为utr),矩阵Mr则是从实体空间到关系r的空间的映射矩阵。头实体的具体映射过程为uhr=uhMr.(2-5)尾实体的具体映射过程为utr=utMr.(2-6)更进一步地,TransR的作者发现不同的三元组的关系r可能具有不同的含义,可以对关系r的语义进行进一步精确挖掘,于是这便有了CTransR。对于每一个三元组(h,r,t),CTransR通过将uhut作为该三元组的关系r的语义表示。对于每一个关系r,将r对应的每个三元组的r的语义表示向量uhut进行聚类,得到关8
【参考文献】:
期刊论文
[1]基于句法结构分析的中文问题分类[J]. 文勖,张宇,刘挺,马金山. 中文信息学报. 2006(02)
本文编号:3070014
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
TransE模型
第二章相关研究工作图2-1TransE模型图2-2TransH模型2.1.1复杂关系建模首先,给出复杂关系的定义:给定r0,对于所有的三元组(h,r0,t)∈S,倘若这样的三元组个数大于1,则称这样的关系是复杂关系。复杂关系可以根据该关系两端的头实体和尾实体的数目进一步划分为1-N,N-N和N-1三种类型。上文提到了TransE难以处理复杂关系,这是因为在TransE简单的约束下,对于复杂关系,容易出现不同意义实体的表示向量趋于相同的情况。例如,对于(成都,位于,四川省),(电子科大,位于,四川省)这样的两个三元组,利用TransE来进行知识嵌入的时候,由于需要满足u成都+u位于≈u四川省和u电子科大+u位于≈u四川省这两个条件,故而容易看出,“成都”和“四川时的向量在训练后会趋于相同。针对于TransE模型无法恰当地处理复杂关系的问题,研究者提出了大量的模型。本文主要从中选取了六个最经典的模型来进行介绍。(1)TransH模型为了能对复杂关系进行处理,对于每一个关系r,TransH使用两个向量来进行表示,一个是平移向量lr,一个是法向量wr;同时对于每一个三元组(h,r,t),TransH首先分别将头实体h对应的向量uh和尾实体t对应的向量ut沿着法向量wr投影到关系r对应的超平面上,得到uh⊥和ut⊥,然后再让投影向量uh⊥、ut⊥和lr满足TransE的约束条件,即uh⊥+lr≈ut⊥。其中,uh⊥的计算过程为uh⊥=uhwTruhwr.(2-3)ut⊥的计算过程为ut⊥=utwTrutwr.(2-4)图2-2则是TransH模型的示意图。相比TransE模型,由于TransH多了头实7
电子科技大学硕士学位论文体h、尾实体t在关系超平面进行投影这一步,所以每个实体在不同关系平面上都有不同的向量表示,实体的表示更加灵活,这使得TransH能较好地对复杂关系的情况进行处理。(2)TransR/CTransR模型虽然TransH能够对复杂关系进行一定的正确表示,但是由于其依旧认为实体和关系表示需要处于同一空间,这一点大大减弱了TransH的表示能力。针对于这一点,WangZ等提出了TransR模型。TransR模型认为,实体和关系不应该处于同一个空间,因为实体包含了不同的属性信息,而不同的关系关注着实体的不同属性。故而对于每个三元组(h,r,t),我们要先将头实体h和尾实体t映射到关系r所在的关系空间中,然后再建立头实体h到尾实体t的翻译关系。TransR模型如图2-3所示。图2-3TransR模型上图中,hr是头实体h在关系r的关系空间中的投影(对应的投影向量表示为uhr),tr则是尾实体t在关系r的关系空间中的投影(对应的投影向量表示为utr),矩阵Mr则是从实体空间到关系r的空间的映射矩阵。头实体的具体映射过程为uhr=uhMr.(2-5)尾实体的具体映射过程为utr=utMr.(2-6)更进一步地,TransR的作者发现不同的三元组的关系r可能具有不同的含义,可以对关系r的语义进行进一步精确挖掘,于是这便有了CTransR。对于每一个三元组(h,r,t),CTransR通过将uhut作为该三元组的关系r的语义表示。对于每一个关系r,将r对应的每个三元组的r的语义表示向量uhut进行聚类,得到关8
【参考文献】:
期刊论文
[1]基于句法结构分析的中文问题分类[J]. 文勖,张宇,刘挺,马金山. 中文信息学报. 2006(02)
本文编号:3070014
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3070014.html