基于PLSTM卷积神经网络和共享表示生成器的实体关系抽取的研究和实现
发布时间:2021-12-09 16:00
实体关系抽取是自然语言处理的一个重要任务,由于传统的有监督分类方法往往需要大量的人工标注工作,效率低下,基于远程监督的关系抽取成为了新的研究热点。远程监督有一个强假设条件,如果两个实体存在某种关系,那么所有同时包含这两个实体的句子都在某种程度上表达了这种关系,因为这个假设实际中并不总是成立,导致自动标注的数据集中会引入较多的噪声。如何缓解远程监督中的噪声问题是当前亟待解决的研究难点。本文结合多示例学习,从句子向量表示和包向量表示两个方面来改进关系抽取的性能。在句子向量表示上,为了改进传统分段卷积神经网络忽略了段间语义关联性的问题,本文引入了BiLSTM序列化建模来学习更多关联特征,并提出了基于分段LSTM卷积神经网络PLSTM-CNN进行文本向量表示的方法。在包向量表示上,本文提出了新的共享表示生成器进行特征空间转换,将句子从原始语义空间映射到和目标关系语义相关的特征空间,从而过滤掉无关噪声的表达。和主流的注意力加权机制不同,本文提出的方法具有更强的非线性拟合能力,并且能提取更多的示例共同特征。此外本文还引入了额外的生成器损失来提高其性能。本文提出的改进方法都具有良好的可扩展性,其中共...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2-1基于远程监督的关系抽取方法流程图??2.1.2监
图2-2神经元模型示意图??
图2-3基于attention机制的encoder-decodei?翻译模型??在该模型中,表示编码端输入,伙hT}是采用RNN模??
本文编号:3530910
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2-1基于远程监督的关系抽取方法流程图??2.1.2监
图2-2神经元模型示意图??
图2-3基于attention机制的encoder-decodei?翻译模型??在该模型中,表示编码端输入,伙hT}是采用RNN模??
本文编号:3530910
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3530910.html