基于深度学习的出生缺陷关系抽取及知识图谱的构建

发布时间:2021-02-09 07:47
  出生缺陷是指胎儿在形成发育时期形成的机体结构、代谢或功能异常等,它严重影响着出生人口质量和儿童的生命健康,使得患儿的生活质量得不到保障。此外,它还给患者家庭带来了沉重的精神和经济压力。目前国内关于出生缺陷的相关统计信息较少,缺乏对出生缺陷疾病相关信息系统性地整合,这对出生缺陷的防预和治疗非常不利。针对这个问题,本研究基于共现的方法,从PubMed历年文献中筛选出生缺陷与表型/症状、基因、致畸物/药物等共同出现的句子。首先,本文对这些句子进行了假阳性处理,根据远程监督的思想,利用UMLS定义的关系,人工给句子中两个实体标注关系,从而建立起出生缺陷相关的语料库。然后,利用人工标注好的语料库训练了三种不同的深度学习关系抽取模型,分别为Bi-LSTM+Attention、PCNN+Attention和BERT+Softmax模型。本文依据这三种模型的预测结果,采用多数表决和高置信度的方法,生成最终的关系抽取预测模型以得到<实体,关系,实体>三元组。接下来将三元组相关信息存储在图数据库Neo4j中,构建了出生缺陷领域的知识图谱。最后,利用训练好的预测模型对新句子进行预测从而推断出句子... 

【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:81 页

【学位级别】:硕士

【部分图文】:

基于深度学习的出生缺陷关系抽取及知识图谱的构建


知识图谱构建流程图

模型图,毕业论文,师范大学,模型


Word2vec的两种训练模型

结构图,单元,结构图,毕业论文


华东师范大学硕士学位毕业论文25图2-2LSTM单元结构图LSTM单元组成的单层网络结构如图2-3所示:图2-3LSTM网络结构图输入门(InputGate)主要用来控制当前时刻的输入,决定当前时刻的输入有多少可以被保存到单元(Cell)状态。遗忘门(ForgetGate)控制着上一时刻的单元状态有多少“记忆”可以被保留至当前时刻。它使得神经网络具有了选择记忆

【参考文献】:
期刊论文
[1]基于BI-GRU-CRF模型的中文分词法[J]. 车金立,唐力伟,邓士杰,苏续军.  火力与指挥控制. 2019(09)
[2]知识图谱技术综述[J]. 徐增林,盛泳潘,贺丽荣,王雅芳.  电子科技大学学报. 2016(04)
[3]出生缺陷概况及产前筛查[J]. 吴怡,程蔚蔚.  中国计划生育和妇产科. 2016(01)
[4]大型中医药知识图谱构建研究[J]. 于彤,刘静,贾李蓉,张竹绿,杨硕,刘丽红,李敬华,于琦.  中国数字医学. 2015(03)
[5]孕中期产前筛查/产前诊断在减少出生缺陷中的价值[J]. 张方芳,徐永莲,张光艳,刘佳,侯丽娜,伍文霞,余沂菲.  中国妇幼保健. 2013(28)
[6]出生缺陷的相关因素及预防现状分析[J]. 曾小玲.  现代诊断与治疗. 2012(06)

硕士论文
[1]基于深度学习的中文文本实体关系抽取研究与实现[D]. 佘恒.北京邮电大学 2019
[2]融合上下文信息的汉语分词方法研究[D]. 李质轩.北京交通大学 2018



本文编号:3025311

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3025311.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户11481***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com