基于神经网络的电子病历实体识别
发布时间:2023-03-02 19:39
电子病历是指记录病人从进入医院到结账出院期间所接受的所有诊断和治疗过程的原始信息。它除了包含大量医学术语、医患间的自由叙述,即医嘱、忌口、查房记录和患者对肢体疼痛的描述外,还包含了检验结果及其单位或剂量﹑频繁出现的缩写药物名等。通过对电子病历进行识别获得的医学实体以及其他医学领域相关的术语,对加快构建计算机辅助诊断系统的智能化起着非常重要的作用。最近,越来越多的学者们尝试将深度学习模型应用于对电子病历医学实体识别任务中。本文采用BERT模型和在序列标注任务上应用最为广泛的双向长短时记忆网络开展了医学领域命名实体的识别研究,并进行了实验验证。首先,实验数据使用全国知识图谱与语义计算大会2018年的电子病历评测数据,分别在BiLSTM-CRF和BERT模型下进行实验,从中文电子病历文档中提取医学类命名实体并采用BIO标注策略给出其所属的实体类别和位置信息。其次,探讨增加领域数据集对模型识别效果的影响,采用BiLSTM-CRF和BERT模型对扩充后的数据集进行实验。实验结果证明,通过增加领域数据能有效提升模型的识别效果。最后,将两组数据集上的实验结果与CRF基线系统和前人的工作进行对比与分析...
【文章页数】:56 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状
1.2.1 通用命名实体识别研究现状
1.2.2 电子病历实体识别研究现状
1.3 本文研究内容与组织结构
第二章 命名实体识别相关研究方法与理论介绍
2.1 基于统计学习的命名实体识别研究
2.1.1 基于分类模型的实体识别
2.1.2 基于概率图模型的实体识别
2.2 基于神经网络的实体识别
2.2.1 基于简单神经网络的方法
2.2.2 基于深度神经网络的方法
2.3 本章小结
第三章 基于神经网络的电子病历实体识别
3.1 研究概述
3.2 基于CRF的电子病历实体识别
3.3 基于BiLSTM-CRF的电子病历实体识别
3.4 基于BERT的电子病历实体识别
3.4.1 电子病历实体识别的BERT模型输入表示
3.4.2 BERT预训练
3.5 本章小结
第四章 实验结果与分析
4.1 数据集
4.2 实体识别评价指标
4.3 实验设置
4.4 实验结果与分析
4.4.1 CRF
4.4.2 BiLSTM-CRF
4.4.3 BERT
4.4.4 实验对比
4.5 本章小结
第五章 总结与展望
5.1 本文的工作总结
5.2 展望
参考文献
攻读学位期间的科研成果
致谢
本文编号:3752509
【文章页数】:56 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状
1.2.1 通用命名实体识别研究现状
1.2.2 电子病历实体识别研究现状
1.3 本文研究内容与组织结构
第二章 命名实体识别相关研究方法与理论介绍
2.1 基于统计学习的命名实体识别研究
2.1.1 基于分类模型的实体识别
2.1.2 基于概率图模型的实体识别
2.2 基于神经网络的实体识别
2.2.1 基于简单神经网络的方法
2.2.2 基于深度神经网络的方法
2.3 本章小结
第三章 基于神经网络的电子病历实体识别
3.1 研究概述
3.2 基于CRF的电子病历实体识别
3.3 基于BiLSTM-CRF的电子病历实体识别
3.4 基于BERT的电子病历实体识别
3.4.1 电子病历实体识别的BERT模型输入表示
3.4.2 BERT预训练
3.5 本章小结
第四章 实验结果与分析
4.1 数据集
4.2 实体识别评价指标
4.3 实验设置
4.4 实验结果与分析
4.4.1 CRF
4.4.2 BiLSTM-CRF
4.4.3 BERT
4.4.4 实验对比
4.5 本章小结
第五章 总结与展望
5.1 本文的工作总结
5.2 展望
参考文献
攻读学位期间的科研成果
致谢
本文编号:3752509
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3752509.html