面向企业图谱构建的关系抽取技术研究

发布时间:2024-06-28 05:26
  实体关系抽取是自然语言处理领域中的重要任务之一,同时也是知识图谱构建过程中的关键一步。实体关系抽取的目的是从自然语言文本中提取出实体之间的关联关系,从而把实体联系起来,形成以三元组为知识单元的网状知识库,成为知识图谱的知识来源。在实体关系抽取领域,已经有很多的方法提出来,但是仍然存在各种问题。本文通过深入研究各种关系抽取方法,针对企业图谱构建这一实际目标,提出了两种基于深度学习的关系抽取模型。由于目前的研究主要是基于英文数据集的,而且中文标准数据集缺乏。本文通过网络爬虫的方式,并利用远程监督的方法构建了一个用于企业关系抽取的数据集。数据的主要来源是上市公司公告和企业新闻。为了使实验更具有说服力,本文在最后的实验阶段,还使用了一个标准的英文关系抽取数据集。传统的关系抽取方法通常需要制定大量的规则,或者构造复杂的特征工程,随着深度学习的发展,基于深度学习的关系抽取算法渐渐被提出来了。本文在目前研究的基础上,提出了两种改进的基于深度学习的关系抽取模型。第一种模型是BiGRU-CNN模型,该模型是将BiGRU网络和CNN网络以串联的方式组合,同时利用了CNN网络和RNN网络的优势。另一种模型是...

【文章页数】:72 页

【学位级别】:硕士

【部分图文】:

图2-1基于传统模式匹配方法的信息抽取系统体系结构

图2-1基于传统模式匹配方法的信息抽取系统体系结构

东南大学硕士学位论文8图2-1基于传统模式匹配方法的信息抽取系统体系结构上述部分并不是每个信息抽取系统必须包含的。图2-1为基于传统模式匹配方法的信息抽取系统体系结构。在知识图谱构建中,实体消歧和共指消解被划分到知识融合而不是信息抽取中。2.1.2关系抽取任务中的相关概念基本概念....


图2-2基于机器学习的关系抽取流程

图2-2基于机器学习的关系抽取流程

11图2-2基于机器学习的关系抽取流程机器学习的分类算法有:朴素贝叶斯,逻辑斯谛回归,最近邻算法,决策树,支持向量机,最大熵模型等等。在关系抽取任务中,最常用的机器学习算法是逻辑斯谛回归算法、支持向量机和最大熵模型。下面简要描述三种分类器。逻辑斯谛回归:逻辑斯谛回归分类器是一种广....


图2-3逻辑斯谛分布的分布函数和密度函数

图2-3逻辑斯谛分布的分布函数和密度函数

11图2-2基于机器学习的关系抽取流程机器学习的分类算法有:朴素贝叶斯,逻辑斯谛回归,最近邻算法,决策树,支持向量机,最大熵模型等等。在关系抽取任务中,最常用的机器学习算法是逻辑斯谛回归算法、支持向量机和最大熵模型。下面简要描述三种分类器。逻辑斯谛回归:逻辑斯谛回归分类器是一种广....


图2-4SVM示意图

图2-4SVM示意图

13隔的分离超平面。对于线性可分离的训练数据集,存在无限多个线性可分离的超平面。但是,具有最大几何间距的超平面是唯一的。图2-4SVM示意图如图2-4所示,其中的实线就是SVM最优分类超平面,距离该超平面最近的样本点被称为“支持向量机”。考虑如何找到具有最大几何间距的另一个超平面....



本文编号:3996494

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3996494.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户67117***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com