睡眠呼吸疾病分析决策系统的关键技术研究和实现
发布时间:2021-09-30 02:00
随着互联网的日益发展,各行各业的用户量和数据量都呈现爆炸式的增长。面对越来越多的数据量,传统的数据库和分析系统已经不能满足行业的业务需求,大数据框架成为近年来热点,不仅提供了对结构和非结构的存储查询模式,而且支持智能决策的大数据分析和智能挖掘计算技术。在医疗行业中,不但存在大量传统的病人、医生信息等结构化管理数据,同时存在大量诊断记录、监测、影像等非结构化数据,如何有效利用大数据技术,实现数据的多维统计分析,为医生提供多视角、直观的病人信息,为诊疗决策提供依据;如何利用数据挖掘技术,从大量历史病例中挖掘潜在规律,实现病因追溯、疾病建模、自动诊疗方案建议等智能医疗。因而研究大数据架构下,研究医疗数据分析、智能计算相关技术,为智能医疗平台构建提供经验,具有良好的应用意义。为实现医疗大数据分析平台,本文以睡眠呼吸疾病为案例,采用大数据实时处理框架Druid,作为系统的数据仓库,实现联机分析处理(OLAP)的数据统计分析模块。采用开源大数据框架Spark作为数据挖掘模块的分析引擎,使用改进的加权FP-growth等算法对数据进行聚类分析、关联规则挖掘。在此基础上,完成了核心功能模块设计开发。主...
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
系统功能结构图
图 2-3 数据采集模块逻辑结构图Fid 2-3 Logical structure diagram of data collection module数据采集模块逻辑结构图如图 2-3 所示,包括感知数据采集和离线数据两个部分。(1) 感知数据采集包括三个功能模块:数据缓存、数据 ETL 通道和数据控制。数据缓存 —— 用于对多源在线流式数据进行分区缓存,确保接入数据整性。该模块使用 Kafka 软件工具通过配置缓存通道实现。数据 ETL 通道 —— 用于对接入的流式数据进行 ETL 处理,其中一个ETL 通道可以对应一个或多个在线流式数据源。该模块拟使用 Spark Strea软件工具作为基础运行框架,通过开发 Spark Streaming 应用实现各数据 ET道实例。数据 ETL 通道的部署和运行管理可由 Spark 框架的内嵌机制完成。数据采集控制器 —— 用于根据数据提供者的需求,在线自动配置相应据缓存区域,并与 Spark Streaming 平台交互,触发数据 ETL 通道的部署和功能。
第 2 章 睡眠呼吸病情分析决策系统概述储、离线数据存储两个方面。由于读写模式的不同,在线和离线两类数据将采用不同的存储管理机制。其中在线数据(感知数据)存储实现对感知数据的缓存和持久化转存;离线数据(历史数据)存储实现对数据的基本原子操作,如增、删、改、查等。
本文编号:3414899
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
系统功能结构图
图 2-3 数据采集模块逻辑结构图Fid 2-3 Logical structure diagram of data collection module数据采集模块逻辑结构图如图 2-3 所示,包括感知数据采集和离线数据两个部分。(1) 感知数据采集包括三个功能模块:数据缓存、数据 ETL 通道和数据控制。数据缓存 —— 用于对多源在线流式数据进行分区缓存,确保接入数据整性。该模块使用 Kafka 软件工具通过配置缓存通道实现。数据 ETL 通道 —— 用于对接入的流式数据进行 ETL 处理,其中一个ETL 通道可以对应一个或多个在线流式数据源。该模块拟使用 Spark Strea软件工具作为基础运行框架,通过开发 Spark Streaming 应用实现各数据 ET道实例。数据 ETL 通道的部署和运行管理可由 Spark 框架的内嵌机制完成。数据采集控制器 —— 用于根据数据提供者的需求,在线自动配置相应据缓存区域,并与 Spark Streaming 平台交互,触发数据 ETL 通道的部署和功能。
第 2 章 睡眠呼吸病情分析决策系统概述储、离线数据存储两个方面。由于读写模式的不同,在线和离线两类数据将采用不同的存储管理机制。其中在线数据(感知数据)存储实现对感知数据的缓存和持久化转存;离线数据(历史数据)存储实现对数据的基本原子操作,如增、删、改、查等。
本文编号:3414899
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3414899.html