基于糖尿病知识图谱的语义识别模型设计与应用

发布时间:2021-07-23 02:08
  近几年随着中国经济的快速发展,人们越来越重视自身的健康情况,并且互联网的广泛普及也极大的促进了互联网医疗的发展,同时互联网也在多年的发展过程中,积累了大量的行业数据,包括医疗相关的科技论文、医院的医嘱、病例等数字化的医疗数据。众多相关的数据资源分布在不同的平台上,形成了数据孤岛,当人们搜索相关的资料时,需要自己去从不同的搜索结果中整理总结出相关的信息,这将会耗费人们很大的精力。而谷歌最早提出的服务于智能搜索的知识图谱技术,可以用于整合不同来源的异构数据。本文将利用知识图谱的相关技术,构建一个糖尿病相关的知识图谱,一方面希望能帮助科研工作者或医疗从业人员快捷方便的查询相关的知识,另一方面也希望能为糖尿病相关的各种智能服务提供数据支撑。本文的主要研究内容有以下几点:首先设计了糖尿病知识图谱的整体构建流程,该图谱一共包含15种实体类别和10种关系类别,并使用ArangoDB数据库进行图谱的存储,可以为各种智能服务提供了数据层面的支持。其次,在糖尿病知识图谱的构建过程中,针对实体识别任务,本文在常用的算法模型的基础上,引入了多级别的词向量特征。实验结果表明本文提出的多级别的词向量和字符向量相结... 

【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校

【文章页数】:70 页

【学位级别】:硕士

【部分图文】:

基于糖尿病知识图谱的语义识别模型设计与应用


线性链条件随机场

序列,神经网络


第2章相关理论技术概述8神经网络自动抽取特征的能力和CRF通过上下文特征获得全局最优条件概率的优势相结合,在进行序列标注时取得了较好的结果。循环神经网络(RNN)是一种用于处理时序数据的网络,它在每一个时刻t的输出与当前时刻的输入以及前一时刻的隐藏状态1有关,其网络结构如图2.2所示:图2.2循环神经网络结构x是输入,h是隐藏单元,o为输出,对于t时刻:=(+1+)………………………(2.4)=+……………………………(2.5)其中f是激活函数,可以使tanh,sigmoid等,b和c为偏置。RNN网络在层数比较多的时候,面临梯度消失和梯度爆炸的问题,为了解决这一问题,长短期记忆网络LSTM(LongShort-TermMemory)在RNN的基础上改进了门控制结构,LSMT比RNN多了一个细胞状态,它蕴含着之前所有时刻的信息,LSTM的三个门结构来控制细胞状态,其节点单元的内部结构如下图2.3所示:图2.3LSTM节点单元的内部结构

序列,单元,节点,神经网络


第2章相关理论技术概述8神经网络自动抽取特征的能力和CRF通过上下文特征获得全局最优条件概率的优势相结合,在进行序列标注时取得了较好的结果。循环神经网络(RNN)是一种用于处理时序数据的网络,它在每一个时刻t的输出与当前时刻的输入以及前一时刻的隐藏状态1有关,其网络结构如图2.2所示:图2.2循环神经网络结构x是输入,h是隐藏单元,o为输出,对于t时刻:=(+1+)………………………(2.4)=+……………………………(2.5)其中f是激活函数,可以使tanh,sigmoid等,b和c为偏置。RNN网络在层数比较多的时候,面临梯度消失和梯度爆炸的问题,为了解决这一问题,长短期记忆网络LSTM(LongShort-TermMemory)在RNN的基础上改进了门控制结构,LSMT比RNN多了一个细胞状态,它蕴含着之前所有时刻的信息,LSTM的三个门结构来控制细胞状态,其节点单元的内部结构如下图2.3所示:图2.3LSTM节点单元的内部结构


本文编号:3298371

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3298371.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d2b07***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com