基于深度神经网络的中文医疗文本实体识别
发布时间:2022-08-04 10:34
近年来我国的医疗产业朝着信息化方向快速发展,国家也大力推动医疗产业互联网化。全国各地医院等医疗部门也大力推行医院信息系统,电子病历开始大量出现并迅速推广,如何有效利用这些电子病历并让其更加推动医疗信息化是当前的首要任务。电子病历是病人就医过程中记录的图像,文字,数据,影像等信息。并且电子病历中一般包含着相当多的医疗实体,具有很高的医疗价值。因此很多研究学者研究从电子病历中识别医疗实体。本文通过深入研究电子病历,电子病历中通常包含病人的会诊记录,出院和住院记录,医生的医嘱等文本形式记录,这些记录里有很多的医疗信息比如患者身体信息,患者的病情,患者的检查结果等。然而在医疗文本中存在一部分的非连续行医疗实体。这些非连续性医疗实体在实体命名识别中被忽略,基于此,本文在基于深度神经网络的基础上,改进出一种新型方法CNN-GRU-LSTM,这个方法不仅在识别连续性医疗文本上效果较好,同时在处理非连续性医疗文本中效果也高于现有的实体命名识别方法。为了有效识别医疗文本中的非连续实体,本文在基于链式CRF模型的基础上,结合卷积神经网络和GRU-CRF,构建一个新的深度神经网络。通过卷积神经网络特征学习层...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 相关工作研究现状
1.2.1 中文实体命名识别研究现状
1.2.2 医疗领域实体命名识别研究现状
1.2.3 非连续文本实体命名识别研究现状
1.3 本论文研究主要内容
1.4 本论文的结构安排
第二章 基于循环神经网络的基本方法与技术
2.1 长短序列记忆网络
2.1.1 LSTM神经网络
2.1.2 双向LSTM神经网络
2.2 门控循环单元
2.2.1 GRU神经网络
2.2.2 双向GRU神经网络
2.3 条件随机场
2.4 卷积神经网络
2.5 其他神经网络整体模型
2.5.1 LSTM-CRF神经网络模型
2.5.2 GRU-CRF神经网络模型
2.6 本章小结
第三章 数据处理与应用
3.1 数据集介绍
3.1.1 DCMD数据集构建
3.2 数据预处理过程
3.2.1 中文分词
3.2.2 数据集的标注方法
3.3 词语向量初始化
3.4 本章小结
第四章 基于改进的实体命名识别算法的研究
4.1 CNN-GRU-CRF整体网络模型
4.1.1 网络模型原理
4.1.2 模型结构流程
4.2 实验与结果分析
4.2.1 评价指标
4.2.2 实验配置与参数
4.2.3 实验结果与分析
4.3 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
致谢
参考文献
缩略词
【参考文献】:
期刊论文
[1]全国知识图谱与语义计算大会(CCKS 2018)在天津隆重召开[J]. 中文信息学报. 2018(11)
[2]基于GloVe与SVM的文本分类研究[J]. 郑亚南,田大钢. 软件导刊. 2018(06)
[3]基于深度神经网络的命名实体识别方法研究[J]. GUL Khan Safi Qamas,尹继泽,潘丽敏,罗森林. 信息网络安全. 2017(10)
[4]基于超图的非连续法律实体识别[J]. 徐建忠,朱俊,赵瑞,张亮,李娇娇. 信息技术与信息化. 2017(05)
[5]基于word embedding和CNN的情感分类模型[J]. 蔡慧苹,王丽丹,段书凯. 计算机应用研究. 2016(10)
[6]在线医疗文本中的实体识别研究[J]. 苏娅,刘杰,黄亚楼. 北京大学学报(自然科学版). 2016(01)
[7]基于CRF和规则相结合的地理命名实体识别方法[J]. 何炎祥,罗楚威,胡彬尧. 计算机应用与软件. 2015(01)
[8]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[9]浅谈中文分词技术[J]. 夏利玲. 科技资讯. 2011(32)
[10]电子病历中命名实体的智能识别[J]. 叶枫,陈莺莺,周根贵,李昊旻,李莹. 中国生物医学工程学报. 2011(02)
博士论文
[1]临床医疗文本中实体时序化问题研究[D]. 刘增健.哈尔滨工业大学 2018
硕士论文
[1]基于机器学习与链路预测的医疗问答检测与推荐系统[D]. 邢新国.电子科技大学 2019
[2]基于改进的LSTM的文本情感分析研究[D]. 闫勇莉.大连海事大学 2018
[3]基于深度神经网络模型的句子级文本情感分类研究[D]. 徐莹莹.深圳大学 2016
本文编号:3669382
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 相关工作研究现状
1.2.1 中文实体命名识别研究现状
1.2.2 医疗领域实体命名识别研究现状
1.2.3 非连续文本实体命名识别研究现状
1.3 本论文研究主要内容
1.4 本论文的结构安排
第二章 基于循环神经网络的基本方法与技术
2.1 长短序列记忆网络
2.1.1 LSTM神经网络
2.1.2 双向LSTM神经网络
2.2 门控循环单元
2.2.1 GRU神经网络
2.2.2 双向GRU神经网络
2.3 条件随机场
2.4 卷积神经网络
2.5 其他神经网络整体模型
2.5.1 LSTM-CRF神经网络模型
2.5.2 GRU-CRF神经网络模型
2.6 本章小结
第三章 数据处理与应用
3.1 数据集介绍
3.1.1 DCMD数据集构建
3.2 数据预处理过程
3.2.1 中文分词
3.2.2 数据集的标注方法
3.3 词语向量初始化
3.4 本章小结
第四章 基于改进的实体命名识别算法的研究
4.1 CNN-GRU-CRF整体网络模型
4.1.1 网络模型原理
4.1.2 模型结构流程
4.2 实验与结果分析
4.2.1 评价指标
4.2.2 实验配置与参数
4.2.3 实验结果与分析
4.3 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
致谢
参考文献
缩略词
【参考文献】:
期刊论文
[1]全国知识图谱与语义计算大会(CCKS 2018)在天津隆重召开[J]. 中文信息学报. 2018(11)
[2]基于GloVe与SVM的文本分类研究[J]. 郑亚南,田大钢. 软件导刊. 2018(06)
[3]基于深度神经网络的命名实体识别方法研究[J]. GUL Khan Safi Qamas,尹继泽,潘丽敏,罗森林. 信息网络安全. 2017(10)
[4]基于超图的非连续法律实体识别[J]. 徐建忠,朱俊,赵瑞,张亮,李娇娇. 信息技术与信息化. 2017(05)
[5]基于word embedding和CNN的情感分类模型[J]. 蔡慧苹,王丽丹,段书凯. 计算机应用研究. 2016(10)
[6]在线医疗文本中的实体识别研究[J]. 苏娅,刘杰,黄亚楼. 北京大学学报(自然科学版). 2016(01)
[7]基于CRF和规则相结合的地理命名实体识别方法[J]. 何炎祥,罗楚威,胡彬尧. 计算机应用与软件. 2015(01)
[8]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[9]浅谈中文分词技术[J]. 夏利玲. 科技资讯. 2011(32)
[10]电子病历中命名实体的智能识别[J]. 叶枫,陈莺莺,周根贵,李昊旻,李莹. 中国生物医学工程学报. 2011(02)
博士论文
[1]临床医疗文本中实体时序化问题研究[D]. 刘增健.哈尔滨工业大学 2018
硕士论文
[1]基于机器学习与链路预测的医疗问答检测与推荐系统[D]. 邢新国.电子科技大学 2019
[2]基于改进的LSTM的文本情感分析研究[D]. 闫勇莉.大连海事大学 2018
[3]基于深度神经网络模型的句子级文本情感分类研究[D]. 徐莹莹.深圳大学 2016
本文编号:3669382
本文链接:https://www.wllwen.com/shoufeilunwen/mpalunwen/3669382.html
最近更新
教材专著