基于CRF模型的临床医嘱信息实体识别方法应用研究
发布时间:2021-01-27 10:57
将命名实体识别技术运用于临床业务系统中,实现对临床医嘱的实体识别,提高临床医疗的工作效率。以上海市胸科医院为研究背景,提出嵌入于临床业务信息系统的临床医嘱实体识别方法。基于历年医嘱数据建立专项语料词库,运用CRF模型进行实时实体识别。随着识别系统上线使用,共处理了8 362条医嘱,实验结果表明其准确率较好,在信息支撑度方面提升了医护人员的满意度。医嘱实体识别技术能够有效提高执行效率和医疗质量,也为医疗领域的知识挖掘工作提供了参考依据。
【文章来源】:计算机应用与软件. 2020,37(03)北大核心
【文章页数】:4 页
【部分图文】:
医嘱实体识别流程框架
在前期的准备工作中,我们从内外科中各选择一个病区,对当日医生签开的所有医嘱进行后期人工标注,以此作为训练集及初始专项词库,同时将2018年12月的历史医嘱数据加入测试集。由于CRF的特征函数对输入序列在限定窗口下的文本具有相关约束关系[7],由此分析基于初始专项词库的测试集中医嘱文本通过CRF模型输出结果的影响,并加入训练集中不断迭代学习。最终,测试集的分析结果显示,近似估计归一因子Zx=0.8。测试分析过程见图2。2 实证运行分析
统计在药物类(D)、检查类(E)、耗材类(M)、手术类(O)和护理类(N)这五类医嘱实体识别上的表现,其结果见图3。可以看出,药物类(D)、耗材类(M)、手术类(O)和护理类(N)医嘱实体识别的准确率均在80%以上,已可满足临床业务中准确识别医嘱的要求。然而,检查类(E)的效果仍不理想,造成此类状况的原因,一是医生偏好用缩略语来描述检查或检验,如气管镜检查可缩写为TBB、TBLB、EBUS等;另外,还存在部分医生用特殊符号与缩略语组合的形式来表示一套检查项目,如PT·电·肝肾、PCT·血RT·肝肾等,导致出现专项词库无法及时对应的状况。
【参考文献】:
期刊论文
[1]胸腺瘤结构化专病数据库构建研究[J]. 袁骏毅,汤钦华,马群圣. 中国医疗设备. 2019(02)
[2]基于深度学习的电子病历命名实体识别[J]. 夏宇彬,郑建立,赵逸凡,徐霄玲. 电子科技. 2018(11)
[3]基于医疗类别的电子病历命名实体识别研究[J]. 李飞,朱艳辉,王天吉,徐啸,冀相冰. 湖南工业大学学报. 2018(04)
[4]非结构化电子病历中信息抽取的定制化方法[J]. 包小源,黄婉晶,张凯,金梦,李岩,牛承志. 北京大学学报(医学版). 2018(02)
[5]基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J]. 李丽双,郭元凯. 中文信息学报. 2018(01)
[6]基于CRF模型的短文本信息流话题提取[J]. 王宗尧,刘金岭,崔俊峰,王敏. 淮阴工学院学报. 2016(05)
[7]词边界字向量的中文命名实体识别[J]. 姚霖,刘轶,李鑫鑫,刘宏. 智能系统学报. 2016(01)
[8]中文电子病历命名实体标注语料库构建[J]. 曲春燕,关毅,杨锦锋,赵永杰,刘雅欣. 高技术通讯. 2015 (02)
本文编号:3002931
【文章来源】:计算机应用与软件. 2020,37(03)北大核心
【文章页数】:4 页
【部分图文】:
医嘱实体识别流程框架
在前期的准备工作中,我们从内外科中各选择一个病区,对当日医生签开的所有医嘱进行后期人工标注,以此作为训练集及初始专项词库,同时将2018年12月的历史医嘱数据加入测试集。由于CRF的特征函数对输入序列在限定窗口下的文本具有相关约束关系[7],由此分析基于初始专项词库的测试集中医嘱文本通过CRF模型输出结果的影响,并加入训练集中不断迭代学习。最终,测试集的分析结果显示,近似估计归一因子Zx=0.8。测试分析过程见图2。2 实证运行分析
统计在药物类(D)、检查类(E)、耗材类(M)、手术类(O)和护理类(N)这五类医嘱实体识别上的表现,其结果见图3。可以看出,药物类(D)、耗材类(M)、手术类(O)和护理类(N)医嘱实体识别的准确率均在80%以上,已可满足临床业务中准确识别医嘱的要求。然而,检查类(E)的效果仍不理想,造成此类状况的原因,一是医生偏好用缩略语来描述检查或检验,如气管镜检查可缩写为TBB、TBLB、EBUS等;另外,还存在部分医生用特殊符号与缩略语组合的形式来表示一套检查项目,如PT·电·肝肾、PCT·血RT·肝肾等,导致出现专项词库无法及时对应的状况。
【参考文献】:
期刊论文
[1]胸腺瘤结构化专病数据库构建研究[J]. 袁骏毅,汤钦华,马群圣. 中国医疗设备. 2019(02)
[2]基于深度学习的电子病历命名实体识别[J]. 夏宇彬,郑建立,赵逸凡,徐霄玲. 电子科技. 2018(11)
[3]基于医疗类别的电子病历命名实体识别研究[J]. 李飞,朱艳辉,王天吉,徐啸,冀相冰. 湖南工业大学学报. 2018(04)
[4]非结构化电子病历中信息抽取的定制化方法[J]. 包小源,黄婉晶,张凯,金梦,李岩,牛承志. 北京大学学报(医学版). 2018(02)
[5]基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J]. 李丽双,郭元凯. 中文信息学报. 2018(01)
[6]基于CRF模型的短文本信息流话题提取[J]. 王宗尧,刘金岭,崔俊峰,王敏. 淮阴工学院学报. 2016(05)
[7]词边界字向量的中文命名实体识别[J]. 姚霖,刘轶,李鑫鑫,刘宏. 智能系统学报. 2016(01)
[8]中文电子病历命名实体标注语料库构建[J]. 曲春燕,关毅,杨锦锋,赵永杰,刘雅欣. 高技术通讯. 2015 (02)
本文编号:3002931
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3002931.html