面向金融知识图谱的实体和关系联合抽取算法
发布时间:2021-06-20 08:37
在知识图谱的构建过程中,传统方法先进行命名实体识别,再进行关系抽取,导致任务间关联信息的丢失,而且忽略了实体间的重叠关系。为此,基于能识别重叠关系的Bi-LSTM+CRF模型,通过参数共享实现两个任务联合学习,充分利用任务间联系来优化结果。公开数据集上的实验结果表明:所提出模型在实体识别上取得了78. 4%的f1值,在非重叠关系和重叠关系的抽取上取得了50. 5%和45. 0%的f1值。为验证该方法可后续用于金融知识图谱构建,提取了小型金融数据集来验证其在金融数据上的泛化能力。
【文章来源】:重庆理工大学学报(自然科学). 2020,34(05)北大核心
【文章页数】:11 页
【部分图文】:
LSTM结构
在实体和关系联合抽取的任务中,我们将句子映射到词向量空间后输入模型,使用双向长短期记忆网络捕捉句子中的语义信息,然后结合条件随机场,对每个输入句子得到预测的实体标注序列,作为实体部分的输出。我们将实体类型标注结果变换后和长短期记忆网络的输入拼合在一起,作为关系分类器的输入,分类器输出的多维向量代表对每个标注的实体对间可能存在的多种关系的预测,也就是关系部分的输出。模型整体框架见图1。2.1.2 实体识别模型
之后这一输出被送入CRF层[19],其结构示意如图3所示。对于每一个输入序列X=(x1,…,xn),当前预测序列标签为y=(y1,…,yn),CRF对这个预测打分为
本文编号:3238859
【文章来源】:重庆理工大学学报(自然科学). 2020,34(05)北大核心
【文章页数】:11 页
【部分图文】:
LSTM结构
在实体和关系联合抽取的任务中,我们将句子映射到词向量空间后输入模型,使用双向长短期记忆网络捕捉句子中的语义信息,然后结合条件随机场,对每个输入句子得到预测的实体标注序列,作为实体部分的输出。我们将实体类型标注结果变换后和长短期记忆网络的输入拼合在一起,作为关系分类器的输入,分类器输出的多维向量代表对每个标注的实体对间可能存在的多种关系的预测,也就是关系部分的输出。模型整体框架见图1。2.1.2 实体识别模型
之后这一输出被送入CRF层[19],其结构示意如图3所示。对于每一个输入序列X=(x1,…,xn),当前预测序列标签为y=(y1,…,yn),CRF对这个预测打分为
本文编号:3238859
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/3238859.html