区域健康医疗数据集成模式研究与实现
发布时间:2022-02-15 14:29
近年来,随着大数据技术的不断发展,医疗卫生领域数据的价值也逐渐突显。因此,实现医疗数据的信息共享变得尤为重要。然而,由于我国医疗信息化建设前期缺乏统一的技术和标准规范要求,导致目前各类医疗信息系统间数据难以共享的“数据孤岛”现象。这种现象严重阻碍了大数据技术在医疗健康领域的应用,阻碍了我国医疗健康业的发展。通过对区域健康医疗数据的异构特性进行研究,不难发现导致区域异构医疗数据集成困难的主要原因有以下几点:1.不同医疗机构建设的医疗信息系统采用的数据结构不统一。2.不同医疗信息系统建设过程中采用的数据标准各有不同。3.传统的接口开发数据共享方式效率低,缺少统一高效的区域健康医疗数据集成共享平台。本文针对上述问题分别从数据标准、数据集成方法以及数据集成效率三个方面逐层展开。首先依据国家卫生部门发布的医疗数据标准结合其它各省市建设经验,根据本地区实际情况制定了电子病历和健康档案数据标准。然后引入元数据概念,通过映射匹配的方法建立起源数据结构与目标数据结构间的映射关系。通过值域映射的方法建立源数据标准与统一数据标准间的字典映射关系。从而构建起一套基于元数据的异构医疗数据集成模式,很好的解决了异...
【文章来源】:合肥工业大学安徽省211工程院校教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
联邦数据库系统模型
合肥工业大学专业硕士研究生学位论文6图2.1联邦数据库系统模型Fig2.1Federaldatabasesystemmodel(2)中间件模式:中间件集成方法是当前常用的一种模式集成方法,也是通过建立全局模式的方法实现访问不同数据源。中间件模式和联邦数据库不同之处在于可以实现半结构化或非结构化数据源信息(如XML、Web等信息)的数据集成。典型的中间件集成系统主要由中间件和封装器组成,每一个封装器对应一个数据源,封装器对每个数据源的数据模式进行封装,将数据源的数据模式转换为符合全局模式要求的通用数据模式。中间件将数据请求分解成若干可以由各个数据源处理的子数据请求,通过封装器转换成各数据源可以辨识的数据模式执行并将结果返回给中间件。基于中间件的集成模型如图2.2。图2.2基于中间件的集成模型Fig2.2Integrationmodelbasedonmiddleware
第二章相关理论与技术概述7(3)数据仓库:数据仓库的核心思想是将分布在不同地方的异构数据源数据模式通过元数据管理模块转换成数据仓库模式,然后加载到数据仓库中统一存储从而实现数据集成。之后通过数据仓库统一对外提供数据共享和基于数据仓库的决策分析。基于数据仓库的数据集成模型如图2.3。图2.3基于数据仓库的数据集成模型Fig2.3Dataintegrationmodelbasedondatawarehouse2.2ETL技术2.2.1ETL概述ETL(Extract-Transform-Load)是数据集成的核心组成部分,主要负责将分布在不同地域的异构数据源中的数据从数据源端通过抽娶转换并最终加载到目标数据源[15]。在设计ETL时一般分为数据抽娶数据清洗转换以及数据加载三个阶段。数据抽取是指将分布在各个不同数据源中的数据抽取到临时数据库的操作,在抽取过程中针对不同的数据源和数据需求,一般可按数据抽取方式划分为增量抽取和全量抽龋数据清洗主要是指将一些不符合要求的数据(比如不完整的数据、错误的数据或者重复的数据等)通过预先设定的过滤条件过滤并返回给数据源对应的过滤信息。数据转换主要是对于语义异构的数据(同名异义、同义异名等)以及其它一些特殊的数据要求进行处理的过程。设定数据转换规则是整个ETL过程中最为复杂的一步,通常会占用整个ETL过程80%的工作量。最后一步数据加载主要是将经过清洗转换后符合要求的数据加载到目标数据源中。ETL工作模型如图2.4。
【参考文献】:
期刊论文
[1]卫生信息数据标准开发方法研究[J]. 赵霞,刘丹红,李小华,胡晓晔,陈道远. 中国数字医学. 2019(08)
[2]映射模式在门诊疾病诊断名称标准化工作中的应用[J]. 曾跃萍,宋菲,田明月,张欣,刘帅. 中国病案. 2019(07)
[3]基于HEFT和CPOP的相关任务表调度算法[J]. 刘林东,邬依林. 计算机系统应用. 2019(03)
[4]国内外卫生信息化发展研究比较[J]. 董晓彤,王香,刘福蓬,田梦珂,张玥,曹高芳. 中国卫生事业管理. 2019(02)
[5]大数据环境下基于元模型控制的数据质量保障技术研究[J]. 杨冬菊,徐晨阳. 计算机工程与科学. 2019(02)
[6]病案首页元数据与FHIR元素映射关系研究[J]. 王雪梅,刘敏超,季磊,刘莉,李俊,周杰. 中国数字医学. 2018(08)
[7]Storm环境下基于权重的任务调度算法[J]. 鲁亮,于炯,卞琛,英昌甜,师康利,蒲勇霖. 计算机应用. 2018(03)
[8]基于Apriori算法的病案首页数据分析[J]. 吴锐东,张卯红,董静,赵雯筠. 中国数字医学. 2018(01)
[9]区域异构医疗数据集成与交换技术的研究和实现[J]. 程颖,焦攀科,戴飞,甘会哲. 信息系统工程. 2017(11)
[10]区域医疗卫生信息化建设存在的主要问题及对策研究[J]. 李恺,吕寻伟. 信息技术与信息化. 2017(03)
硕士论文
[1]基于本体的医疗异构数据集成研究与应用[D]. 陆旭.天津工业大学 2019
[2]基于关联规则的电子病历数据挖掘应用研究[D]. 李宇斐.华中科技大学 2017
[3]基于关联规则的健康信息平台研究与设计[D]. 李亚军.北京交通大学 2016
[4]长株潭区域医疗信息平台建设研究[D]. 姚宁宁.中南大学 2013
本文编号:3626793
【文章来源】:合肥工业大学安徽省211工程院校教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
联邦数据库系统模型
合肥工业大学专业硕士研究生学位论文6图2.1联邦数据库系统模型Fig2.1Federaldatabasesystemmodel(2)中间件模式:中间件集成方法是当前常用的一种模式集成方法,也是通过建立全局模式的方法实现访问不同数据源。中间件模式和联邦数据库不同之处在于可以实现半结构化或非结构化数据源信息(如XML、Web等信息)的数据集成。典型的中间件集成系统主要由中间件和封装器组成,每一个封装器对应一个数据源,封装器对每个数据源的数据模式进行封装,将数据源的数据模式转换为符合全局模式要求的通用数据模式。中间件将数据请求分解成若干可以由各个数据源处理的子数据请求,通过封装器转换成各数据源可以辨识的数据模式执行并将结果返回给中间件。基于中间件的集成模型如图2.2。图2.2基于中间件的集成模型Fig2.2Integrationmodelbasedonmiddleware
第二章相关理论与技术概述7(3)数据仓库:数据仓库的核心思想是将分布在不同地方的异构数据源数据模式通过元数据管理模块转换成数据仓库模式,然后加载到数据仓库中统一存储从而实现数据集成。之后通过数据仓库统一对外提供数据共享和基于数据仓库的决策分析。基于数据仓库的数据集成模型如图2.3。图2.3基于数据仓库的数据集成模型Fig2.3Dataintegrationmodelbasedondatawarehouse2.2ETL技术2.2.1ETL概述ETL(Extract-Transform-Load)是数据集成的核心组成部分,主要负责将分布在不同地域的异构数据源中的数据从数据源端通过抽娶转换并最终加载到目标数据源[15]。在设计ETL时一般分为数据抽娶数据清洗转换以及数据加载三个阶段。数据抽取是指将分布在各个不同数据源中的数据抽取到临时数据库的操作,在抽取过程中针对不同的数据源和数据需求,一般可按数据抽取方式划分为增量抽取和全量抽龋数据清洗主要是指将一些不符合要求的数据(比如不完整的数据、错误的数据或者重复的数据等)通过预先设定的过滤条件过滤并返回给数据源对应的过滤信息。数据转换主要是对于语义异构的数据(同名异义、同义异名等)以及其它一些特殊的数据要求进行处理的过程。设定数据转换规则是整个ETL过程中最为复杂的一步,通常会占用整个ETL过程80%的工作量。最后一步数据加载主要是将经过清洗转换后符合要求的数据加载到目标数据源中。ETL工作模型如图2.4。
【参考文献】:
期刊论文
[1]卫生信息数据标准开发方法研究[J]. 赵霞,刘丹红,李小华,胡晓晔,陈道远. 中国数字医学. 2019(08)
[2]映射模式在门诊疾病诊断名称标准化工作中的应用[J]. 曾跃萍,宋菲,田明月,张欣,刘帅. 中国病案. 2019(07)
[3]基于HEFT和CPOP的相关任务表调度算法[J]. 刘林东,邬依林. 计算机系统应用. 2019(03)
[4]国内外卫生信息化发展研究比较[J]. 董晓彤,王香,刘福蓬,田梦珂,张玥,曹高芳. 中国卫生事业管理. 2019(02)
[5]大数据环境下基于元模型控制的数据质量保障技术研究[J]. 杨冬菊,徐晨阳. 计算机工程与科学. 2019(02)
[6]病案首页元数据与FHIR元素映射关系研究[J]. 王雪梅,刘敏超,季磊,刘莉,李俊,周杰. 中国数字医学. 2018(08)
[7]Storm环境下基于权重的任务调度算法[J]. 鲁亮,于炯,卞琛,英昌甜,师康利,蒲勇霖. 计算机应用. 2018(03)
[8]基于Apriori算法的病案首页数据分析[J]. 吴锐东,张卯红,董静,赵雯筠. 中国数字医学. 2018(01)
[9]区域异构医疗数据集成与交换技术的研究和实现[J]. 程颖,焦攀科,戴飞,甘会哲. 信息系统工程. 2017(11)
[10]区域医疗卫生信息化建设存在的主要问题及对策研究[J]. 李恺,吕寻伟. 信息技术与信息化. 2017(03)
硕士论文
[1]基于本体的医疗异构数据集成研究与应用[D]. 陆旭.天津工业大学 2019
[2]基于关联规则的电子病历数据挖掘应用研究[D]. 李宇斐.华中科技大学 2017
[3]基于关联规则的健康信息平台研究与设计[D]. 李亚军.北京交通大学 2016
[4]长株潭区域医疗信息平台建设研究[D]. 姚宁宁.中南大学 2013
本文编号:3626793
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3626793.html
最近更新
教材专著