电力领域实体关系抽取及知识图谱构建研究
发布时间:2024-03-18 22:43
随着知识图谱构建技术的日益完善,越来越多基于知识图谱的应用开始出现。人们的目光开始从通用领域知识图谱转向垂直领域知识图谱。垂直领域知识图谱的领域性较强,根据业务需求会存在不同的数据类型以及数据模式。关系抽取是信息抽取任务中子任务,是构建知识图谱的关键步骤之一,意图从非结构化的数据中获得已识别实体的关系并对知识图谱进行填充。本文主要对知识图谱构建中关系抽取这一任务进行研究,针对不用类型的电力文本,使用不同的关系抽取方法进行电力领域实体三元组抽取,并绘制图谱。本文从两个方面进行研究:(1)针对电力调度管理规程文本,本文采用依存句法分析的方法对实体三元组进行抽取。通过对抽取实体进行补全以及对于长难句并列结构的处理,基于基本的汉语语法结构,围绕核心动词自动抽取了较为准确的实体三元组。结果证明对于文章结构特征明显但句子结构复杂的电力调度管理规程文本,基于依存句法分析的关系抽取方法依旧可以较好的效果。最后将自动抽取结果同文本中的结构化数据结合绘制知识图谱。(2)针对网上可获取的大量数据,本文采用远程监督方法构建了一个电力领域用于实体关系抽取的数据集。分别对比了双向长短期记忆网络、卷积神经网络以及分...
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
本文编号:3931928
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
图1-1基于机器学习的关系抽取流程图
中国地质大学(北京)硕士学位论文3方法构建了医学中疾病和病症之间的关系的语料库。首先对疾病以及病症的实体进行识别,然后根据依存句法获取模板,最终通过人工校对得到了较为均衡的疾病与病症的实体关系抽取训练集。基于规则的方法可以获取较高的准确率,但是由于所获得的一系列模板只能对部分语句....
图2-1CBOW模型结构示意图
中国地质大学(北京)硕士学位论文11通过使用线性映射得到了概念的隐含空间表达。Mikolov[33][34]等人于2013年提出目前普遍使用两个模型:连续词袋模型(ContinuousBagofWord,CBOW)以及连续跳跃语法模型(ContinuousSkip-Gram)。图....
图2-2Skip-gram模型结构示意图
相关理论基础12图2-2Skip-gram模型结构示意图2.2卷积神经网络卷积神经网络(ConvolutionalNeuralNetwork,CNN)于1995年由YannLeCun[35]首次提出。卷积神经网络是一种深层的前馈神经网络,具有局部感受野、权值共享以及池化三个重要思....
图2-3LeNet-5卷积神经网络结构示意图[36]
相关理论基础12图2-2Skip-gram模型结构示意图2.2卷积神经网络卷积神经网络(ConvolutionalNeuralNetwork,CNN)于1995年由YannLeCun[35]首次提出。卷积神经网络是一种深层的前馈神经网络,具有局部感受野、权值共享以及池化三个重要思....
本文编号:3931928
本文链接:https://www.wllwen.com/kejilunwen/dianlidianqilunwen/3931928.html