多元时序Shapelets及其在ICU医学应用的研究
发布时间:2020-07-16 03:51
【摘要】:时间序列数据是指带有时间戳的,会随时间发生变化的一系列数据。时间序列数据一般都是带有领域特性的,且都具有高维海量特点,这就导致传统的数据挖掘方式无法高效的处理这类数据,无法获得有用的知识。时间序列分类问题是时序数据挖掘当中的一类经典问题,现存的时序分类方法分类可解释性不好,分类速度不优。时间序列Shapelets是提取序列样本中的某一子序列来对时间序列数据进行快速且准确分类操作,该子序列具有极高的辨别性。ICU医学预测作为典型的多元时序数据分类问题,对其进行准确预测具有重大意义。因此,本文基于上述情况展开了以下几点研究:第一,构建多元时间序列Shapelets模型。多元时序数据维度高,基于点的统计分布思想对其建立相应的多元时序Shapelets模型。其基本的思想路线是对多元时序数据所有属性进行归一化操作后提取局部特征点集,根据统计学中的分位点能全面描述局部特征点点集的分布的思想,对局部特征点点集提取分位点;再依据给定的分位点定义获取分位点所在序列的子序列构成的Shapelets候选集;根据提出的全局Shapelets提取法(利用多元时序间的相似性和信息增益值是否有所提升来筛选候选项)选取候选集中分类效果最优的k个全局Shapelet;最后根据给定的距离度量方式将这k个Shapelet转换为新的Shapelets数据集。第二,提出基于多元时序Shapelets的ICU病员死亡预测框架。在shapelets构造阶段,对ICU数据集的时序属性执行缺失值处理后得到任一病员的生理属性的矩阵模型,依据多元时序Shapelets模型提取最优k个全局Shapelet,并计算到每个序列样本的距离从而构建新的数据集。在预测阶段,对新病员的生理指标数据进行属性归一化,使用上一阶段得到的数据集构造分类器,得到最优分类器并对将新病员的多元时序数据最为输入执行分类操作,获得最终分类结果。第三,通过实验效果论证了算法的有效性以及算法框架的实用性。
【学位授予单位】:南昌大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R459.7;O211.61
【图文】:
图 1.1 某股的价格走势图 1.2 某病员的心电图数据ICU 医学预测中 ICU 内病员的生死预测是典型的多元时序分类问题。ICU全称 Intensive Care Unit,即重症监护室,是一种医疗形式的体现,汇集了当前较为先进的医疗技术以及护理技术为重症患者进临床治疗,保障了技术上的支持,期望救治成效良好。ICU 内病员的生死预测可帮助改善 ICU 内病员的治疗方案,很大程度上使得治疗成本得到缓解,同时也增加了病员的存活机率。在医学领域,对 ICU 内病员的生死预测有其领域特征的评分系统[5],不少学者也
图 1.2 某病员的心电图数据ICU 医学预测中 ICU 内病员的生死预测是典型的多元时序分类问题。ICU全称 Intensive Care Unit,即重症监护室,是一种医疗形式的体现,汇集了当前较为先进的医疗技术以及护理技术为重症患者进临床治疗,保障了技术上的支持,期望救治成效良好。ICU 内病员的生死预测可帮助改善 ICU 内病员的治疗方案,很大程度上使得治疗成本得到缓解,同时也增加了病员的存活机率。在医学领域,对 ICU 内病员的生死预测有其领域特征的评分系统[5],不少学者也对评分系统进行了改进或创新研究,然而临床成效不佳。此外,也有不少学者期望从统计分析角度对 ICU 内数据进行分析,但是 ICU 数据的特性使得其成效也不好。近几年,随着数据挖掘的发展,部分学者利用其知识发现的特性对 ICU数据进行处理分析,发现预测效果较评分系统方式和统计分析方式而言,比较良好。且 ICU 数据在记录过程中都带有时间戳,且其生理特性使得数据维度较高,是典型的时序数据,对 ICU 病员的预测结果为两种,生或死,因此 ICU 病员的死亡预测是多元时序分类问题。本文从时序数据挖掘中多元时间序列分类角度考虑,解析时序数据特性,
( )2ii 1Gini D 1 p ( ) ( ) ( 1 2A 1 D DGini D Gini D Gini D D 过程中对领域知识没有要求,因此建的模型为白盒模型。所谓白盒模,因此,分类是数据挖掘领域重要的t Neighbor, 谁近是谁。NN 表示该模决。KNN 分类过程可概述为:选取别的对象与样本对象集合中的距离,这 k 个当中同一类的样本数目最多得选取不同问题不同取值,一般在具 2.2 为某一未知类别的样本进行 KN
本文编号:2757482
【学位授予单位】:南昌大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R459.7;O211.61
【图文】:
图 1.1 某股的价格走势图 1.2 某病员的心电图数据ICU 医学预测中 ICU 内病员的生死预测是典型的多元时序分类问题。ICU全称 Intensive Care Unit,即重症监护室,是一种医疗形式的体现,汇集了当前较为先进的医疗技术以及护理技术为重症患者进临床治疗,保障了技术上的支持,期望救治成效良好。ICU 内病员的生死预测可帮助改善 ICU 内病员的治疗方案,很大程度上使得治疗成本得到缓解,同时也增加了病员的存活机率。在医学领域,对 ICU 内病员的生死预测有其领域特征的评分系统[5],不少学者也
图 1.2 某病员的心电图数据ICU 医学预测中 ICU 内病员的生死预测是典型的多元时序分类问题。ICU全称 Intensive Care Unit,即重症监护室,是一种医疗形式的体现,汇集了当前较为先进的医疗技术以及护理技术为重症患者进临床治疗,保障了技术上的支持,期望救治成效良好。ICU 内病员的生死预测可帮助改善 ICU 内病员的治疗方案,很大程度上使得治疗成本得到缓解,同时也增加了病员的存活机率。在医学领域,对 ICU 内病员的生死预测有其领域特征的评分系统[5],不少学者也对评分系统进行了改进或创新研究,然而临床成效不佳。此外,也有不少学者期望从统计分析角度对 ICU 内数据进行分析,但是 ICU 数据的特性使得其成效也不好。近几年,随着数据挖掘的发展,部分学者利用其知识发现的特性对 ICU数据进行处理分析,发现预测效果较评分系统方式和统计分析方式而言,比较良好。且 ICU 数据在记录过程中都带有时间戳,且其生理特性使得数据维度较高,是典型的时序数据,对 ICU 病员的预测结果为两种,生或死,因此 ICU 病员的死亡预测是多元时序分类问题。本文从时序数据挖掘中多元时间序列分类角度考虑,解析时序数据特性,
( )2ii 1Gini D 1 p ( ) ( ) ( 1 2A 1 D DGini D Gini D Gini D D 过程中对领域知识没有要求,因此建的模型为白盒模型。所谓白盒模,因此,分类是数据挖掘领域重要的t Neighbor, 谁近是谁。NN 表示该模决。KNN 分类过程可概述为:选取别的对象与样本对象集合中的距离,这 k 个当中同一类的样本数目最多得选取不同问题不同取值,一般在具 2.2 为某一未知类别的样本进行 KN
【参考文献】
相关期刊论文 前5条
1 原继东;王志海;韩萌;游洋;;基于逻辑shapelets转换的时间序列分类算法[J];计算机学报;2015年07期
2 李祯盛;何振峰;;基于主成分分析的时间序列Shapelet提取方法[J];计算机系统应用;2014年11期
3 陈朝虹;玮娜;黄启凯;吴效明;;基于双谱分析—BP神经网络的ICU急性低血压发生预测模型研究[J];中国医学物理学杂志;2011年05期
4 赖丽娟;王志刚;吴效明;熊冬生;;基于支持向量机的ICU中急性低血压预测模型研究[J];生物医学工程学杂志;2011年03期
5 赖丽娟;王志刚;吴效明;;基于小波变换和支持向量机的急性低血压预测方法研究[J];透析与人工器官;2011年01期
本文编号:2757482
本文链接:https://www.wllwen.com/kejilunwen/yysx/2757482.html