基于深度学习的中文关系抽取方法研究
发布时间:2021-04-11 23:47
关系抽取是指检测和识别文本语句中实体之间的语义关系。关系抽取作为自然语言处理的关键一环,对自然语言处理的许多应用如自动问答、知识图谱等具有重要的意义。近几年,深度学习模型已经成为关系抽取的最先进方法,然而关于中文关系抽取的研究工作却很少。本文针对中文关系抽取面临的字词之间无明显的分割标志,分词误差会被引入关系抽取系统中;以及缺乏公开的标记中文语料等问题。首先基于远程监督思想,从复旦知识工厂、百度百科中提取关系三元组,通过与开放的中文语料搜狐新闻数据集中的文本进行对齐,构建了一个中文人物关系数据集。然后提出了一个用于远程监督中文关系抽取的多示例多标签双向长短时记忆神经网络(BLSTM)模型。以字向量和位置向量作为输入,避免了引入中文分词错误;注意机制用于提取更丰富的汉字和句子特征;在神经网络分类器中使用多个二分类函数做多标签分类来处理重叠关系。为了提高关系抽取模型的性能,又提出了一个改进的基于注意力池化BGRU的关系抽取模型,该模型将LSTM替换为神经元结构更简单的GRU,在字级注意力层后添加了分段最大池化层,结合了RNN可以捕获全局信息和分段最大池化可以提取结构信息的特点,而分类器则采...
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
RNN展开图[66]
五种常见的RNN架构[68]
卷积神经网络架构图
本文编号:3132184
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
RNN展开图[66]
五种常见的RNN架构[68]
卷积神经网络架构图
本文编号:3132184
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3132184.html
最近更新
教材专著