基于深度学习的电子病历中医疗知识抽取研究
发布时间:2022-02-17 17:16
随着互联网技术在医学领域的应用,大量具有丰富医学知识的电子病历随之产生。其中隐含着患者的诊断与症状、用药情况及治疗方式之间的潜在联系。对这些隐含知识进行分析与挖掘可以为临床辅助决策提供帮助,还可以为后续建立结构化的医疗领域知识图谱提供基础支持。然而,由于电子病历为医务人员所撰写的非结构化自由本文,其表述复杂,包含了大量医疗领域专业词汇,且在一定程度上受撰写者书写习惯影响。所以,对电子病历中包含的医疗知识实现高效准确地抽取仍然面临着巨大的挑战。本文依托于自然语言处理与深度学习技术,对医疗知识抽取中的命名实体识别与医疗关系抽取任务进行了深入的研究与探讨,并提出了可用性强的实现方案,解决了现有方法存在的过于依赖人工操作、特征稀疏、方法适用性差、模型运行效率低等问题,并在抽取效果上取得了显著的提升。本文的主要工作主要分为以下三部分:(一)对于常见的分布式文本表示方法,本文通过实验对比选取了GloVe模型,并将维基百科与所使用的I2B2 2010英文电子病历文本共同作为词向量训练的语料库,最终构建得到了电子病历文本的单词向量。而且本文考虑到单词对文本信息表示稀疏的问题,将字母信息作为特征补充,构...
【文章来源】:杭州师范大学浙江省
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数
杭州师范大学硕士学位论文研究综述与相关理论12图2-3ReLU函数采用ReLU激活函数的神经元在计算上更加高效。此外,在优化方面,ReLU激活函数为左饱和函数,且在>0时导数为1,相对于Sigmoid型函数的两端饱和,ReLU函数在一定程度上缓解了神经网络中可能会出现的梯度消失问题,并在反向传播过程中梯度下降的收敛速度上有较大提升。(3)Tanh激活函数Tanh函数是也就是双曲正切函数,它可以将输入值变换到-1与1之间。Tanh的函数曲线与Sigmoid函数的类似,只是Tanh的函数关于坐标系原点对称。Tanh函数可以看作是放大并平移的Sigmoid函数,不过由于Tanh是0均值的,其在实际应用中效果会好于Sigmoid函数。()=121+2(2.4)图2-4Tanh函数
杭州师范大学硕士学位论文研究综述与相关理论12图2-3ReLU函数采用ReLU激活函数的神经元在计算上更加高效。此外,在优化方面,ReLU激活函数为左饱和函数,且在>0时导数为1,相对于Sigmoid型函数的两端饱和,ReLU函数在一定程度上缓解了神经网络中可能会出现的梯度消失问题,并在反向传播过程中梯度下降的收敛速度上有较大提升。(3)Tanh激活函数Tanh函数是也就是双曲正切函数,它可以将输入值变换到-1与1之间。Tanh的函数曲线与Sigmoid函数的类似,只是Tanh的函数关于坐标系原点对称。Tanh函数可以看作是放大并平移的Sigmoid函数,不过由于Tanh是0均值的,其在实际应用中效果会好于Sigmoid函数。()=121+2(2.4)图2-4Tanh函数
【参考文献】:
期刊论文
[1]无指导的中文开放式实体关系抽取[J]. 秦兵,刘安安,刘挺. 计算机研究与发展. 2015(05)
[2]CRF与规则相结合的医学病历实体识别[J]. 栗伟,赵大哲,李博,彭新茗,刘积仁. 计算机应用研究. 2015(04)
[3]电子病历中命名实体的智能识别[J]. 叶枫,陈莺莺,周根贵,李昊旻,李莹. 中国生物医学工程学报. 2011(02)
[4]电子病历基本规范(试行)[J]. 中国卫生质量管理. 2010(04)
[5]用语义模式提取实体关系的方法[J]. 邓擘,樊孝忠,杨立公. 计算机工程. 2007(10)
[6]中文金融新闻中公司名的识别[J]. 王宁,葛瑞芳,苑春法,黄锦辉,李文捷. 中文信息学报. 2002(02)
本文编号:3629804
【文章来源】:杭州师范大学浙江省
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数
杭州师范大学硕士学位论文研究综述与相关理论12图2-3ReLU函数采用ReLU激活函数的神经元在计算上更加高效。此外,在优化方面,ReLU激活函数为左饱和函数,且在>0时导数为1,相对于Sigmoid型函数的两端饱和,ReLU函数在一定程度上缓解了神经网络中可能会出现的梯度消失问题,并在反向传播过程中梯度下降的收敛速度上有较大提升。(3)Tanh激活函数Tanh函数是也就是双曲正切函数,它可以将输入值变换到-1与1之间。Tanh的函数曲线与Sigmoid函数的类似,只是Tanh的函数关于坐标系原点对称。Tanh函数可以看作是放大并平移的Sigmoid函数,不过由于Tanh是0均值的,其在实际应用中效果会好于Sigmoid函数。()=121+2(2.4)图2-4Tanh函数
杭州师范大学硕士学位论文研究综述与相关理论12图2-3ReLU函数采用ReLU激活函数的神经元在计算上更加高效。此外,在优化方面,ReLU激活函数为左饱和函数,且在>0时导数为1,相对于Sigmoid型函数的两端饱和,ReLU函数在一定程度上缓解了神经网络中可能会出现的梯度消失问题,并在反向传播过程中梯度下降的收敛速度上有较大提升。(3)Tanh激活函数Tanh函数是也就是双曲正切函数,它可以将输入值变换到-1与1之间。Tanh的函数曲线与Sigmoid函数的类似,只是Tanh的函数关于坐标系原点对称。Tanh函数可以看作是放大并平移的Sigmoid函数,不过由于Tanh是0均值的,其在实际应用中效果会好于Sigmoid函数。()=121+2(2.4)图2-4Tanh函数
【参考文献】:
期刊论文
[1]无指导的中文开放式实体关系抽取[J]. 秦兵,刘安安,刘挺. 计算机研究与发展. 2015(05)
[2]CRF与规则相结合的医学病历实体识别[J]. 栗伟,赵大哲,李博,彭新茗,刘积仁. 计算机应用研究. 2015(04)
[3]电子病历中命名实体的智能识别[J]. 叶枫,陈莺莺,周根贵,李昊旻,李莹. 中国生物医学工程学报. 2011(02)
[4]电子病历基本规范(试行)[J]. 中国卫生质量管理. 2010(04)
[5]用语义模式提取实体关系的方法[J]. 邓擘,樊孝忠,杨立公. 计算机工程. 2007(10)
[6]中文金融新闻中公司名的识别[J]. 王宁,葛瑞芳,苑春法,黄锦辉,李文捷. 中文信息学报. 2002(02)
本文编号:3629804
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3629804.html