中文电子病历信息抽取系统的设计与实现
发布时间:2021-01-26 03:49
在计算机技术与信息科学发展浪潮中,医疗信息化建设已经成为医疗行业发展的趋势。电子病历是医疗信息化的载体,包含了患者从入院就诊到出院医疗活动的详细记录,蕴藏着丰富的医学知识,电子病历信息抽取对临床诊断与医学研究都有重要的意义。因此,探索对医学文本抽取准确率高的信息抽取算法成为了重要任务。此外,在医疗大数据的趋势下,近年来电子病历数量急剧增长。而我国目前的医疗信息化水平不高,难以满足大规模数据处理的需要,海量电子病历数据未得到有效的管理和利用,在这样的背景下,本文设计实现了支持大数据处理的中文电子病历信息抽取系统,对医疗信息化建设具有重要的意义。本文的主要工作包括以下几个部分:(1)结合课题背景和研究现状对电子病历信息抽取系统进行了需求分析,设计了系统的整体框架和具体功能,将系统分为存储端、接口层和服务端三个模块。(2)在存储端,设计、部署了HDFS-Redis+MySQL-HBase“三级缓存”结构的存储体系,并对HBase进行了性能优化。满足海量数据存储管理的需求,实现了大规模数据的高效增删改查功能,并方便在本地机器上使用SQL进行数据处理。针对专业性的医学文本数据,对数据库各字段进行...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图2-1系统数据流层次逻辑图??根据系统数据流的层次逻辑,结合现有技术,系统整体设计与模块划分如下??
??/??图2-1系统数据流层次逻辑图??根据系统数据流的层次逻辑,结合现有技术,系统整体设计与模块划分如下??图:??存储端?接口层?|瑕务端??'L-?-,?i?…,.......?j??娜JL晒娜y????i..-■■?■".■...?Jl?一一....一??“三级缓存”?基于RESTful|基于fkdoop?U?NLP?1??存储结构,?的http接□?;?I的傜&抽取^模块J??<?2:m,???????f箄法、医学词典与^??!模型标注语料库??一-J、的构建??图2-2系统整体的框架设计与模块划分??11
北京邮电大学工程硕士学位论文第三章存储端:“三级缓存”结构的存储体系??.1主要工具和技术??.1.1分布式文件系统HDFS??HDFS是一种易于水平扩展的分布式文件系统,它提供了海量数据文务,支持PB级规模的数据存储。它可以部署运行在超过万台廉价机器,具有数据备份和容错、恢复机制,为海量数据的批处理提供性能优秀务[14]。HDFS的架构如下图:??
【参考文献】:
期刊论文
[1]基于双向LSTM神经网络电子病历命名实体的识别模型[J]. 杨红梅,李琳,杨日东,周毅. 中国组织工程研究. 2018(20)
[2]我国基层医疗卫生机构医疗服务能力发展与现状[J]. 牛亚冬,张研,叶婷,张亮. 中国医院管理. 2018(06)
[3]医疗体制改革与医院管理体制创新[J]. 徐伟. 中国卫生标准管理. 2018(10)
[4]面向数据库性能的SQL语句解析与翻译[J]. 崔娜. 现代电子技术. 2016(11)
[5]中文电子病历命名实体和实体关系语料库构建[J]. 杨锦锋,关毅,何彬,曲春燕,于秋滨,刘雅欣,赵永杰. 软件学报. 2016(11)
[6]医疗大数据研究现状及其临床应用[J]. 罗旭,刘友江. 医学信息学杂志. 2015(05)
[7]基于Redis+MySQL+MongoDB存储架构应用[J]. 朱亚兴,余爱民,王夷. 微型机与应用. 2014(13)
[8]大数据环境下基于Hbase的分布式查询优化研究[J]. 杜晓东. 计算机光盘软件与应用. 2014(08)
[9]MapReduce并行编程模型研究综述[J]. 李建江,崔健,王聃,严林,黄义双. 电子学报. 2011(11)
[10]中文电子病历的信息抽取研究[J]. 李毅,保鹏飞,薛万国. 生物医学工程学杂志. 2010(04)
硕士论文
[1]中文电子病历命名实体识别研究[D]. 曲春燕.哈尔滨工业大学 2015
本文编号:3000415
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图2-1系统数据流层次逻辑图??根据系统数据流的层次逻辑,结合现有技术,系统整体设计与模块划分如下??
??/??图2-1系统数据流层次逻辑图??根据系统数据流的层次逻辑,结合现有技术,系统整体设计与模块划分如下??图:??存储端?接口层?|瑕务端??'L-?-,?i?…,.......?j??娜JL晒娜y????i..-■■?■".■...?Jl?一一....一??“三级缓存”?基于RESTful|基于fkdoop?U?NLP?1??存储结构,?的http接□?;?I的傜&抽取^模块J??<?2:m,???????f箄法、医学词典与^??!模型标注语料库??一-J、的构建??图2-2系统整体的框架设计与模块划分??11
北京邮电大学工程硕士学位论文第三章存储端:“三级缓存”结构的存储体系??.1主要工具和技术??.1.1分布式文件系统HDFS??HDFS是一种易于水平扩展的分布式文件系统,它提供了海量数据文务,支持PB级规模的数据存储。它可以部署运行在超过万台廉价机器,具有数据备份和容错、恢复机制,为海量数据的批处理提供性能优秀务[14]。HDFS的架构如下图:??
【参考文献】:
期刊论文
[1]基于双向LSTM神经网络电子病历命名实体的识别模型[J]. 杨红梅,李琳,杨日东,周毅. 中国组织工程研究. 2018(20)
[2]我国基层医疗卫生机构医疗服务能力发展与现状[J]. 牛亚冬,张研,叶婷,张亮. 中国医院管理. 2018(06)
[3]医疗体制改革与医院管理体制创新[J]. 徐伟. 中国卫生标准管理. 2018(10)
[4]面向数据库性能的SQL语句解析与翻译[J]. 崔娜. 现代电子技术. 2016(11)
[5]中文电子病历命名实体和实体关系语料库构建[J]. 杨锦锋,关毅,何彬,曲春燕,于秋滨,刘雅欣,赵永杰. 软件学报. 2016(11)
[6]医疗大数据研究现状及其临床应用[J]. 罗旭,刘友江. 医学信息学杂志. 2015(05)
[7]基于Redis+MySQL+MongoDB存储架构应用[J]. 朱亚兴,余爱民,王夷. 微型机与应用. 2014(13)
[8]大数据环境下基于Hbase的分布式查询优化研究[J]. 杜晓东. 计算机光盘软件与应用. 2014(08)
[9]MapReduce并行编程模型研究综述[J]. 李建江,崔健,王聃,严林,黄义双. 电子学报. 2011(11)
[10]中文电子病历的信息抽取研究[J]. 李毅,保鹏飞,薛万国. 生物医学工程学杂志. 2010(04)
硕士论文
[1]中文电子病历命名实体识别研究[D]. 曲春燕.哈尔滨工业大学 2015
本文编号:3000415
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3000415.html