基于注意力机制的开放域实体关系抽取
发布时间:2021-01-15 12:04
大词林是一个有自动构建能力的网状知识图谱,所谓的网状结构,是指知识的横向性与纵向性。实体之间的关系、一个上位词的同义词都属于横向上的关系,而实体与上位词的关系、上位词之间的层次关系,都属于纵向上的关系。本课题主要为大词林提供辅助,旨在为大词林提供稳定的横向关系补充,即实体间关系的补充。1.针对大词林中纵向关系中实体与横向关系中实体不统一的问题,即实体路径消歧,本文首先提出基于词向量相似度计算的方法,将实体路径信息与实体义项对应,将实体路径信息与实体义项当做两个字符串,利用腾讯提供的词向量计算余弦相似度。该方法对于语义特征较为明显的情况处理效果较好。但在中文中,有很多词是具有对立含义的,为了挖掘文本背后的“对立”关联,本文引进了基于深度学习的实体路径消歧,包括ELMO模型与Bert模型,并对两类模型结果进行了分析。2.在开放域关系抽取任务中,针对中文领域关系抽取任务缺少语料的问题,本文提出了一种基于启发式规则的关系抽取方法,采用4类启发式规则模板并辅以搜索引擎结果计算置信度,得到初步实验效果,并为有监督方法提供语料。随后,针对开放域关系抽取难度大的特点,本文引入了端到端的关系抽取方法,以...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
课题研究流程
- 3 -图 1-2 实体“苹果”的上位词结构果”的上位词有“水果”,“公司”,“科技产品”等,“水果不是一个领域的事物,这说明,在上下位关系中,实体的,“苹果”既可能是一种“水果”,也可能是某个“公关系中存储的实体实际上是未消歧的实体。实体应该拥有明确的概念,并且这种明确的概念能够使需要细粒度语义级别的应用。本文从网络中自动采集了图 1-3 即展示了大词林中实体“苹果”的不同义项。
图 1-3 实体“苹果”的不同义项 1-3 可以看出,实体“苹果”是具有不同义项的,且每个义项有不性)。例如在“苹果(蔷薇科苹果属果实)”义项中拥有关系“食用价关系是不可能在“苹果(苹果产品公司)”中出现的,同理,“苹果)”拥有的“创始人”关系也不会出现在别的不同领域的义项中。路径消歧,指的是把大词林中实体的某条路径,对应到实体的某例如对于路径“苹果->公司->机构->抽象事物”和实体义项“苹司)”及“苹果(蔷薇科苹果属果实)”,应把路径对应到“苹果(苹果。可利用的信息为实体路径信息与实体义项信息,本质上,路径信息若与某个实体义项信息相近,则该实体义项应为路径所对应该任务与文本相似度计算任务很像。因此可利用文本相似度计算解决大词林实体路径消歧。相似度计算一直是学者们研究的热点,先后被提出来的方法包括字面匹配的方法,基于统计的经验主义方法,基于规则的理性主
【参考文献】:
期刊论文
[1]文本相似度计算研究进展综述[J]. 王寒茹,张仰森. 北京信息科技大学学报(自然科学版). 2019(01)
[2]实体链接研究综述[J]. 陆伟,武川. 情报学报. 2015 (01)
[3]神经网络与组合语义在文本相似度中的应用[J]. 肖和,付丽娜,姬东鸿. 计算机工程与应用. 2016(07)
[4]语义分析与词频统计相结合的中文文本相似度量方法研究[J]. 华秀丽,朱巧明,李培峰. 计算机应用研究. 2012(03)
[5]基于核函数中文关系自动抽取系统的实现[J]. 刘克彬,李芳,刘磊,韩颖. 计算机研究与发展. 2007(08)
[6]一种新的句子相似度度量及其在文本自动摘要中的应用[J]. 张奇,黄萱菁,吴立德. 中文信息学报. 2005(02)
本文编号:2978839
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
课题研究流程
- 3 -图 1-2 实体“苹果”的上位词结构果”的上位词有“水果”,“公司”,“科技产品”等,“水果不是一个领域的事物,这说明,在上下位关系中,实体的,“苹果”既可能是一种“水果”,也可能是某个“公关系中存储的实体实际上是未消歧的实体。实体应该拥有明确的概念,并且这种明确的概念能够使需要细粒度语义级别的应用。本文从网络中自动采集了图 1-3 即展示了大词林中实体“苹果”的不同义项。
图 1-3 实体“苹果”的不同义项 1-3 可以看出,实体“苹果”是具有不同义项的,且每个义项有不性)。例如在“苹果(蔷薇科苹果属果实)”义项中拥有关系“食用价关系是不可能在“苹果(苹果产品公司)”中出现的,同理,“苹果)”拥有的“创始人”关系也不会出现在别的不同领域的义项中。路径消歧,指的是把大词林中实体的某条路径,对应到实体的某例如对于路径“苹果->公司->机构->抽象事物”和实体义项“苹司)”及“苹果(蔷薇科苹果属果实)”,应把路径对应到“苹果(苹果。可利用的信息为实体路径信息与实体义项信息,本质上,路径信息若与某个实体义项信息相近,则该实体义项应为路径所对应该任务与文本相似度计算任务很像。因此可利用文本相似度计算解决大词林实体路径消歧。相似度计算一直是学者们研究的热点,先后被提出来的方法包括字面匹配的方法,基于统计的经验主义方法,基于规则的理性主
【参考文献】:
期刊论文
[1]文本相似度计算研究进展综述[J]. 王寒茹,张仰森. 北京信息科技大学学报(自然科学版). 2019(01)
[2]实体链接研究综述[J]. 陆伟,武川. 情报学报. 2015 (01)
[3]神经网络与组合语义在文本相似度中的应用[J]. 肖和,付丽娜,姬东鸿. 计算机工程与应用. 2016(07)
[4]语义分析与词频统计相结合的中文文本相似度量方法研究[J]. 华秀丽,朱巧明,李培峰. 计算机应用研究. 2012(03)
[5]基于核函数中文关系自动抽取系统的实现[J]. 刘克彬,李芳,刘磊,韩颖. 计算机研究与发展. 2007(08)
[6]一种新的句子相似度度量及其在文本自动摘要中的应用[J]. 张奇,黄萱菁,吴立德. 中文信息学报. 2005(02)
本文编号:2978839
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2978839.html