面向糖尿病的临床大数据分析研究与应用
本文关键词:面向糖尿病的临床大数据分析研究与应用
更多相关文章: 糖尿病 多维分析 事件序列 时间窗口 频繁模式挖掘
【摘要】:随着各大医院信息化建设进程的不断推进,医院中的各生产系统如HIS(医院信息化系统)、EMR(电子病历系统)、LIS(实验室检验科信息系统)等已经积累了规模庞大的临床数据。这种临床大数据对于提升临床医疗质量有着深远的意义。糖尿病作为一种慢性病,治疗周期长,容易引发多种并发症(如肾病、眼病),病情反复等特点。糖尿病患者在治疗过程中,会产生大量的临床数据包括就诊信息、实验室检验、临床诊断信息和医嘱用药信息等,这类数据隐含着患者群体特征、病情的变化趋势、药物疗效等关键信息。为了找出数据背后隐藏的知识,临床医疗信息的分析研究也越来越受到医院的重视。为此,本文设计并实现了一个糖尿病临床数据分析应用系统,对糖尿病临床数据进行多维分析和时序挖掘研究,主要工作如下:首先,根据糖尿病临床数据的特点,给出了糖尿病临床数据分析应用系统的架构设计。该系统包括数据预处理模块、多维分析模块以及时序挖掘模块。其中,数据预处理模块主要为系统分析部分提供数据支持。根据系统架构,数据预处理模块将会主要从两个方面组织数据:其一是HANA数据库中数据,按照多维分析模型,构建多维分析事实表与维度表;其二是将临床诊断数据按照诊断事件进行序列化,获得患者体的序列化诊断数据集。然后,结合糖尿病临床数据的具体特点,构建了糖尿病多维分析的星型模型,在此基础上基于SAP Business Object工具对多维分析模块进行了设计与实现。在多维分析过程中涉及到资源配置、根据控件和过滤器的SQL语句动态构造、数据处理等工作,并使用SAP BO的Webi和Dashboards两个组件实现了糖尿病指标、用药、诊断等主题下多个维度分析的图表展示。最后,为了找出糖尿病并发症出现的规律,结合诊断事件的特点,本文对糖尿病历史临床诊断数据进行事件序列化,在此基础上对传统的SPADE算法进行改进,考虑到发病期这个时间窗口的现实应用场景,提出了一种基于时间窗口的糖尿病临床诊断事件序列频繁模式发现算法NFPS。该算法通过时间窗口的设定,结合糖尿病治疗时间间隔,支持对该时间窗口内糖尿病诊断频繁出现模式的发现。通过真实数据集上的实验,验证了本文提出的基于时间窗口的糖尿病诊断事件序列频繁模式发现算法的有效性和实用价值。
【关键词】:糖尿病 多维分析 事件序列 时间窗口 频繁模式挖掘
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-6
- ABSTRACT6-10
- 第一章 绪论10-15
- 1.1 研究背景及意义10-11
- 1.2 国内外研究现状11-12
- 1.3 研究内容12-13
- 1.4 本文组织结构13-14
- 1.5 本章小结14-15
- 第二章 相关技术介绍15-23
- 2.1 OLAP与数据挖掘15-17
- 2.1.1 OLAP技术15-16
- 2.1.2 数据挖掘的概念16-17
- 2.2 时序挖掘17-19
- 2.2.1 时间规准17-18
- 2.2.2 关联分析18-19
- 2.3 SAP BO19-22
- 2.4 本章小结22-23
- 第三章 糖尿病临床数据分析应用系统架构设计23-39
- 3.1 总体架构设计23-25
- 3.2 糖尿病临床数据25-32
- 3.2.1 临床数据结构26-28
- 3.2.2 数据清洗28-29
- 3.2.3 多维立方体的构建29-31
- 3.2.4 诊断事件序列的构建31-32
- 3.3 多维分析模块功能设计32-35
- 3.3.1 分析主题32
- 3.3.2 面向患者基本特征主题的分析模型32-34
- 3.3.3 面向糖尿病诊断的分析模型34
- 3.3.4 面向糖尿病指标与用药分析模型34-35
- 3.4 时序挖掘模块功能设计35-38
- 3.4.1 基于时间窗口的序列优化算法36-37
- 3.4.2 诊断事件频繁模式发现算法NFPS37-38
- 3.5 分析结果可视化38
- 3.6 本章小结38-39
- 第四章 糖尿病临床数据多维分析39-52
- 4.1 糖尿病多维分析数据准备39-43
- 4.1.1 糖尿病多维分析资源发布39-41
- 4.1.2 数据预处理41-43
- 4.2 糖尿病指标分析43-46
- 4.3 糖尿病诊断分析46-49
- 4.4 糖尿病用药分析49-51
- 4.5 本章小结51-52
- 第五章 诊断事件序列频繁模式发现算法52-63
- 5.1 诊断数据序列化52-54
- 5.1.1 患者体属性52-53
- 5.1.2 糖尿病临床诊断数据的序列化53-54
- 5.2 糖尿病临床诊断事件频繁模式发现54-59
- 5.2.1 序列模式挖掘概述55-56
- 5.2.2 算法过程描述56-57
- 5.2.3 NFPS算法实现57-59
- 5.3 实验分析59-61
- 5.3.1 实验环境59
- 5.3.2 实验结果59-61
- 5.4 本章小结61-63
- 第六章 总结和展望63-65
- 6.1 本文总结63-64
- 6.2 展望64-65
- 参考文献65-68
- 致谢68-69
- 攻读学位期间的研究成果目录69
【相似文献】
中国期刊全文数据库 前10条
1 刘萍萍;于帆;陈雷;;多维分析在养老保险原型系统中的应用研究[J];计算机与数字工程;2008年02期
2 赵孟伟;葛迪;;多维分析技术的行业应用研究[J];中国交通信息产业;2008年07期
3 杜典熠;;基于学生评价数据立方的多维分析[J];现代计算机(专业版);2012年27期
4 殷锋,杨甲榜;对病历信息的多维分析[J];计算机应用;2002年06期
5 张宪乐;林逢升;邹会来;;基于安卓的农产品追溯查询信息的多维分析与展现[J];安徽农业科学;2013年33期
6 张涛,宋继良,徐星辉;基于MS Analysis Services多维分析系统的实现[J];哈尔滨理工大学学报;2003年03期
7 刘凤翔;蒋开颜;王国清;;多维分析技术在地税联网审计中的应用[J];审计月刊;2009年08期
8 陈立勇;殷秀叶;;电信行业多维分析模型的构建研究[J];太原大学学报;2013年03期
9 ;细算帐 Oracle Analysis Wizard有机结合动态报告研究与多维分析功能[J];每周电脑报;1998年01期
10 李晋宏,闫鹏,曹丹阳,苏志同,胡健,熊伟;铝电解槽生产数据的多维分析系统[J];北方工业大学学报;2002年01期
中国重要会议论文全文数据库 前4条
1 何璐;李晋宏;范小峗;;生产数据多维分析系统模板研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
2 孟丹;王玲;;铝产品质量数据多维分析与SPC系统设计和实现[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
3 刘云峰;王倩宜;杨旭;欧阳荣彬;;一种支持大数据集成架构的多维分析系统[A];中国高等教育学会教育信息化分会第十二次学术年会论文集[C];2014年
4 韩英军;;深度开发信息资源的思考与实践[A];中国烟草学会2006年学术年会论文集[C];2007年
中国重要报纸全文数据库 前3条
1 雷阳;和勤依托合作伙伴做大BI市场[N];电脑商报;2006年
2 鲁月;浪潮软件主打“一体”牌[N];计算机世界;2003年
3 NCR Teradata数据仓库事业部 富子祺;经营分析保证稳步上升的业绩[N];计算机世界;2004年
中国硕士学位论文全文数据库 前10条
1 杨奇民;智能多维分析在电能质量分析评估中的应用研究[D];华北电力大学;2015年
2 王致强;甲亢疾病数据的多维分析研究与应用[D];东华大学;2016年
3 陈潋;面向糖尿病的临床大数据分析研究与应用[D];东华大学;2016年
4 刘新鸣;主观导向多维分析系统的设计与实现[D];华中科技大学;2009年
5 魏金强;多维分析技术在教务管理系统中的应用与研究[D];北方工业大学;2006年
6 朱济宇;一种面向中小型企业的多维分析方法的研究与实现[D];昆明理工大学;2011年
7 何璐;生产数据多维分析系统模板研究及应用[D];北方工业大学;2008年
8 李京红;网管多维分析系统需求分析与设计[D];北京邮电大学;2011年
9 邱姝;科技基金多维分析系统的分析与设计[D];大连理工大学;2004年
10 马乐;科研成果多维分析系统设计与实现[D];大连理工大学;2007年
,本文编号:885716
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/885716.html