医学疾病表型实体及其关系抽取方法研究
发布时间:2021-11-09 01:39
随着信息和数字化技术的应用,医学领域形成了大量的数字化知识和数据,但截至目前,大部分的医学知识和数据仍以非结构化的文本为主要表达形式,如临床电子病历,中医古籍(如黄帝内经,伤寒杂病论,本草纲目等)和现代医学文献等。从这些大规模文本信息中提取结构化信息是进行深入医学分析和利用的前提,是目前医学数据挖掘的主要瓶颈之一。本文结合表型实体及其关系的抽取问题,分别对临床病历,中医古籍和PubMed题录文献进行人工规范化标注,构建信息抽取标准数据集,然后进行表型命名实体识别及不同实体间关系抽取方法的研究。主要研究工作包括以下三个方面:第一,首先构建10426个现病史症状表型实体识别标准数据集,并且分别应用条件随机场(CRF)和结构化支持向量机(SSVM)进行实体抽取,重点比较分析了传统特征、基于深度表示的字词特征学习方法(Word2Vec和Node2Vec)的性能差异。实验分析发现,基于传统特征的CRF方法的F1值为0.83,而基于Word2Vec词向量的CRF和SSVM方法F1值分别达到了 0.9798和0.9908;同时基于Node2Vec字向量的F1值分别达到0.8879和0.9413,词向...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图2-1链式条件随机场??Figure?2-1?Chain?condition?random?field??
图2-2卷积神经网路的基本模型??Figure?2-2?Basic?model?of?convolutional?neural?networks??
图2-3用于文本模型建立的Attention-BiGRU算法??Figure?2-3?Attention-BiGRU?algorithm?for?text?model?establishment??
【参考文献】:
期刊论文
[1]基于注意力与神经图灵机的语义关系抽取模型[J]. 张润岩,孟凡荣,周勇,刘兵. 计算机应用. 2018(07)
[2]基于深度卷积神经网络模型的文本情感分类[J]. 周锦峰,叶施仁,王晖. 计算机工程. 2019(03)
[3]基于MEDLINE数据库挖掘高尿酸血症的中医药研究[J]. 王毅兴,吴燕升,张春燕,高建东. 中国中西医结合肾病杂志. 2018(02)
[4]面向中医临床现病史文本的命名实体抽取方法研究[J]. 袁玉虎,周雪忠,张润顺,李晓东. 世界科学技术-中医药现代化. 2017(01)
[5]基于条件随机场的中医术语抽取方法及其应用探析[J]. 孟洪宇,孟庆刚. 中华中医药学刊. 2014(10)
[6]生物医学命名实体识别的研究与进展[J]. 郑强,刘齐军,王正华,朱云平. 计算机应用研究. 2010(03)
[7]基于条件随机场的中医命名实体识别[J]. 王世昆,李绍滋,陈彤生. 厦门大学学报(自然科学版). 2009(03)
[8]一种松耦合的生物医学命名实体识别算法[J]. 胡俊锋,陈蓉,陈源,陈浩,于中华. 计算机应用. 2007(11)
[9]中医古籍数字化研究[J]. 符永驰,刘国正,李斌,孙一星,裘俭. 中国中医药信息杂志. 2004(06)
本文编号:3484392
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图2-1链式条件随机场??Figure?2-1?Chain?condition?random?field??
图2-2卷积神经网路的基本模型??Figure?2-2?Basic?model?of?convolutional?neural?networks??
图2-3用于文本模型建立的Attention-BiGRU算法??Figure?2-3?Attention-BiGRU?algorithm?for?text?model?establishment??
【参考文献】:
期刊论文
[1]基于注意力与神经图灵机的语义关系抽取模型[J]. 张润岩,孟凡荣,周勇,刘兵. 计算机应用. 2018(07)
[2]基于深度卷积神经网络模型的文本情感分类[J]. 周锦峰,叶施仁,王晖. 计算机工程. 2019(03)
[3]基于MEDLINE数据库挖掘高尿酸血症的中医药研究[J]. 王毅兴,吴燕升,张春燕,高建东. 中国中西医结合肾病杂志. 2018(02)
[4]面向中医临床现病史文本的命名实体抽取方法研究[J]. 袁玉虎,周雪忠,张润顺,李晓东. 世界科学技术-中医药现代化. 2017(01)
[5]基于条件随机场的中医术语抽取方法及其应用探析[J]. 孟洪宇,孟庆刚. 中华中医药学刊. 2014(10)
[6]生物医学命名实体识别的研究与进展[J]. 郑强,刘齐军,王正华,朱云平. 计算机应用研究. 2010(03)
[7]基于条件随机场的中医命名实体识别[J]. 王世昆,李绍滋,陈彤生. 厦门大学学报(自然科学版). 2009(03)
[8]一种松耦合的生物医学命名实体识别算法[J]. 胡俊锋,陈蓉,陈源,陈浩,于中华. 计算机应用. 2007(11)
[9]中医古籍数字化研究[J]. 符永驰,刘国正,李斌,孙一星,裘俭. 中国中医药信息杂志. 2004(06)
本文编号:3484392
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3484392.html
最近更新
教材专著