健康领域异构数据查询系统设计与实现
发布时间:2020-06-08 11:25
【摘要】:随着社会的发展和经济水平的提高,人们越来越关注自身的健康问题。更多的科研人员开始关注健康领域的数据处理。健康领域的数据比起其他行业,它显得更为庞杂,包括很多结构化数据和半结构化数据。现阶段,健康领域的数据主要还是以医疗机构的数据为主,大量的数据存储在关系型数据库和XML文档中。由于数据呈现出很强的异构性,健康领域形成了大量的信息孤岛。数据在于利用,对于健康领域异构数据的查询,开发人员需要将更多的注意力用在获取数据的方法上,浪费了大量的时间和精力。为了解决这一问题,本文提出建立健康领域异构数据查询系统,解决异构数据的统一查询问题,使得开发人员可以将更多的精力用于数据的使用,节省了开发人员的时间和开发的成本。首先,本文设计健康领域异构数据查询系统的架构,选用中介器-包装器方式进行实现,选用XML Schema作为统一的公共数据模型,选用XQuery作为统一查询语言。系统主要实现数据源注册,模式抽取与转换,模式集成,查询分解四个模块。其次,针对传统的利用手工配置的方式完成模式集成的不足,本文研究了基于XML Schema的语义相似度计算和结构相似度计算,同时定义了模式集成中的三种类型的结构冲突检测和解决方案,完成模式集成工作,生成模式映射文件,大大简化了模式集成的开发工作。针对全局模式重建过程中的结构冲突检测,结合XML Schema的树状结构特性,给出了关系嵌套冲突,关系方向冲突和实体属性冲突的定义,使用树节点之间的路径长度进行结构冲突的检测,进一步降低全局模式中的冗余,完成了本系统中模式集成功能。最后,本文在模式映射文件的基础上,使用XQuery的查询分解算法,实现了XQuery全局查询语句的分解,完成了健康领域关系型数据和XML文档数据的统一查询工作,为业务的开发提供了便利。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.52
本文编号:2703011
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.52
【参考文献】
相关期刊论文 前8条
1 李秉键;;基于中间件的异构数据库数据集成技术研究及实现[J];信息系统工程;2014年01期
2 彭东;;基于XML的异构数据库集成研究[J];舰船电子工程;2013年12期
3 毕亿默;卢超;王华;;一种数据交换整合平台的设计与实现[J];计算机应用与软件;2013年12期
4 杨军;;以信息化手段实现医疗质量的精细化管理与控制[J];中国医院;2013年08期
5 计虹;沈韬;金昌晓;;医院信息系统多元化集成发展的探讨[J];中国医院管理;2013年06期
6 李怀成;;基于医院平台的异构信息系统整合[J];中国卫生信息管理杂志;2012年06期
7 张立;胡正刚;杜智;张书华;;医院信息系统集成平台建设的目的和效果[J];中国卫生信息管理杂志;2012年02期
8 王宁,陈滢,俞本权,徐宏炳,王能斌;一个基于CORBA的异构数据源集成系统的设计[J];软件学报;1998年05期
,本文编号:2703011
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2703011.html