当前位置:主页 > 医学论文 > 医卫管理论文 >

医学表型实体的同义关系分析和概念规范化研究

发布时间:2020-08-15 12:10
【摘要】:医学知识图谱构建是医学人工智能研究的重要问题,是临床诊疗决策支持系统研发的重要支撑,其中表型实体及其关系是医学知识图谱的重要组成部分。然而由于医学术语库的动态变化和医学文本的快速累积,医学知识图谱中表型实体及其关系的维护和更新耗时耗力。因此,自动预测医学术语库间的表型概念同义关系,并建立医学文本中表型术语提及与规范化概念的映射关系是医学知识图谱构建的基础性研究工作。针对以上问题,本文的主要研究工作如下:首先,本文针对不同术语库的表型同义关系分析问题,构建了基于排序学习的分析方法。该方法将表型同义关系预测问题转化为对候选表型术语排序的问题,利用PubMed文献及相关信息,生成表型术语网络嵌入表示。然后通过相似度计算和排序学习的排序方法预测不同表型术语的同义关系。其次,研制了基于分类学习的术语同义关系分析方法。该方法将表型同义关系预测问题转化为对表型关系分类的问题,基于表型术语的网络嵌入表示构建表型术语关系的特征向量,分别使用支持向量机、逻辑回归、多层感知机、朴素高斯贝叶斯和随机森林等分类模型进行表型术语关系分类,然后基于融合分类模型对表型关系分类,进而预测表型之间的同义关系。本文在表型术语同义关系数据集上分别进行了基于排序学习和基于分类学习方法的同义关系预测实验。结果表明,两种方法在表型同义关系分析问题上均有较好的表现,其中基于分类的方法F1最高可达0.942。最后,针对表型概念规范化问题,本文将该问题分解为表型命名实体识别和表型实体链接两个子任务。首先,分别利用卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)学习字符向量和词向量,并结合条件随机场(CRF)构建BiLSTM-CNN-CRF模型,实现表型命名实体识别。然后基于CNN排序模型实现表型实体链接。并在National Center for Biotechnology Information(NCBI)疾病语料库和BioCreative V Chemical Disease Relation(BC5CDR)疾病语料库上进行对比实验,验证了方法的有效性。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;R-05
【图文】:

领域,节点,跳回,概率


游走模型来适用于网络领域的各种定义。N0de2veC定义了两个参数p和q,在广度优先逡逑采样(Breadth-first邋Sampling,邋BFS)和深度优先采样(Depth-first邋Sampling,邋DFS)采样中逡逑达到一个平衡,同时考虑到局部和宏观的信息,具有很高的适应性。如图2-2所示,逡逑控制跳回上一节点的概率,当从t跳到v以后,跳回节点t的概率为1/p,对应BFS。g逡逑对应DFS,控制从节点v跳到其他节点的概率。逡逑图2-2邋node2vec节点领域表示逡逑Figure邋2-2邋node2vec邋node邋field邋representation逡逑2.1.3排序学习逡逑I邋</i邋I'邋^逦 ̄ ̄|i逡逑I邋^逦x:2-1逦i逦i逦…逡逑I邋l;,)逦A邋产逦X;*1逦i逡逑i邋;逦:逦卜夬学习系统逡逑I邋^逦^逦x%逦|逡逑■逦I邋)逦iy{2)逦yf舄)逦:逡逑il丨路集逦Mc?deJ邋h逡逑1逦^逦|p-j|逡逑i邋x.(邋:逦i:邋:、aJ11邋t逦:邋X]邋:逡逑i邋,邋I逦?逦'邋|逡逑!邋:逡逑I邋?邋j逦j邋h{x);逡逑s.逦逡逑MSi"逦sE逡逑图2-3机器学习排序模型逡逑Figure邋2-3邋Machine邋Learning邋to邋Rank邋Model逡逑9逡逑

排序模型,机器学习


游走模型来适用于网络领域的各种定义。N0de2veC定义了两个参数p和q,在广度优先逡逑采样(Breadth-first邋Sampling,邋BFS)和深度优先采样(Depth-first邋Sampling,邋DFS)采样中逡逑达到一个平衡,同时考虑到局部和宏观的信息,具有很高的适应性。如图2-2所示,逡逑控制跳回上一节点的概率,当从t跳到v以后,跳回节点t的概率为1/p,对应BFS。g逡逑对应DFS,控制从节点v跳到其他节点的概率。逡逑图2-2邋node2vec节点领域表示逡逑Figure邋2-2邋node2vec邋node邋field邋representation逡逑2.1.3排序学习逡逑I邋</i邋I'邋^逦 ̄ ̄|i逡逑I邋^逦x:2-1逦i逦i逦…逡逑I邋l;,)逦A邋产逦X;*1逦i逡逑i邋;逦:逦卜夬学习系统逡逑I邋^逦^逦x%逦|逡逑■逦I邋)逦iy{2)逦yf舄)逦:逡逑il丨路集逦Mc?deJ邋h逡逑1逦^逦|p-j|逡逑i邋x.(邋:逦i:邋:、aJ11邋t逦:邋X]邋:逡逑i邋,邋I逦?逦'邋|逡逑!邋:逡逑I邋?邋j逦j邋h{x);逡逑s.逦逡逑MSi"逦sE逡逑图2-3机器学习排序模型逡逑Figure邋2-3邋Machine邋Learning邋to邋Rank邋Model逡逑9逡逑

支持向量机,超平面


(2)支持向量机(Support邋Vector邋Machines,SVM)逡逑支持向量机通常用来解决二分类问题[48]。它的基本模型是定义一个在特征空间上的逡逑间隔最大的线性分类器。如图2-4所示:逡逑#逡逑H邋\邋?邋?逡逑?邋?邋?邋\/\/逡逑\v邋/margin逡逑O逦N/逡逑图2-4支持向量机超平面划分逡逑Figure邋2-4邋The邋Hyper邋plane邋of邋Support邋Vector邋Machine逡逑其中,//是最优超平面,/^和/^分别是两个支持平面,margin是两个平面间的距逡逑离。支持向量机的输入数据为1々=1,2,...,4,输出为;;,少2罚保嗑必

本文编号:2794090

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2794090.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fbe1a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com