基于深度学习模型预测ICU患者死亡率的可解释性研究
发布时间:2022-01-25 08:09
随着医疗卫生事业的发展,电子病历系统得到了长足进步,国家在《“十一五”卫生信息化建设设想》中提出了推进电子病历等卫生信息化工程,依托电子病历系统,医院可以得到大量的有价值的数据并对其进行研究。关于电子病历死亡率方面的研究可以追溯到1991年,如今深度学习算法在很多领域展现了其优秀的性能,因此越来越多的研究人员将深度学习算法应用于电子病历研究。然而一般的深度学习算法无法很好地解释模型分类的依据和原理,人们对模型的信任度低。基于这个问题,本文使用一种可解释的深度学习模型对重症加强护理病房(ICU,Intensive Care Unit)患者的进行分类,并对结果进行解释性的讨论。本文提取了Medical Information Mart for Intensive Care Ⅲ(MIMIC Ⅲ)医学数据库中ICU患者的生理数据,将患者的文本数据转换为图片数据,通过迁移学习,使VGG16深度神经网络和梯度类激活映射(graddient based class activate mapping,Grad-CAM)结合,使用VGG16-Grad-CAM结合方法对患者进行生存,死亡预测,并将结果进行...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
k近邻算法原理图
电子科技大学硕士学位论文14图2-2支持向量机分类原理图如图2-2所示,wx+b=0即为分离超平面,对于线形可分的数据集来说,几何间隔最大的分离超平面只有一个。支持向量机算法即在产生的无数个可分类超平面中寻找几何间隔最大的超平面,达到对样本最好的分类效果。标准的支持向量机算法是一种二分类模型,其学习策略即为间隔最大化。即min12‖‖22.(+)≥1(=1,2,…)(2-1)然而在标准支持向量机中有一对矛盾体,即最大间隔和最小训练误差,于是提出了软间隔支持向量机,软间隔支持向量机的基本思想是对训练集中的每一个样本引入一个松弛变量,使间隔大于等于1,即(+)≥1。并且引入一个惩罚参数,惩罚参数越大对误分类的惩罚越大。使用软间隔最大化可以解决带有异常点的分类问题。2.2.3多层感知机算法多层感知机(MultilayerPerceptron,MLP)又名人工神经网络(ArtificialNeuralNetwork,ANN)[21,22],其结构为输入层,隐藏层,输出层。最简单的多层感知机只有一个隐藏层,多层感知机基本结构如下图。
第二章数据统计及模型认识15图2-3多层感知机模型结构图从图中可以看到,多层感知机每个层之间为全连接的,一开始是输入层,中间是隐藏层,最后是输出层。假设输入为={1,2,3,,},输出为(1+),1为权重,b为偏置,函数f常用sigmoid或者tanh函数。多层感知机的每一个节点即为一个感知器,当信号从输入层被传入时,进入隐藏层,隐藏层节点根据传入的信号进行计算,将计算后的结果传入下一层,最后从输出层输出结果。多层感知机的训练过程即为寻找最佳的权重和偏置等参数使得模型能够最好地拟合数据。2.2.4随机森林算法上世纪八十年代Breiman等人发明了决策树算法,决策树算法通过不断二分类数据进行分类或回归。2001年Breiman把决策树组合为随机森林(RandomForest,RF)[23-25],随机森林是一种Bagging算法的变体,是在以决策树为基学习器构建Bagging集成的基础上,进一步在决策树的训练过程中引入随机属性选择的方法。随机森林是随机化变量提取和数据提取,生成很多无关联的决策树,每一个决策树都是一个弱分类器,最后汇总所有决策树的结果。随机森林算法在没有显著提高计算量的前提下提高了预测精度。下图为随机森林算法结构图。
【参考文献】:
期刊论文
[1]深度学习的可解释性[J]. 吴飞,廖彬兵,韩亚洪. 航空兵器. 2019(01)
[2]国内电子病历发展与应用现状分析[J]. 马锡坤,杨国斌,于京杰. 计算机应用与软件. 2015(01)
[3]急性心肌梗死患者入院时心率水平与死亡率相关性分析[J]. 罗建华,黄征. 浙江中西医结合杂志. 2009(02)
[4]APACHEⅡ与SAPSⅡ评分系统对急诊内科危重患者病情评估价值的比较[J]. 孟新科,邓跃林. 中国危重病急救医学. 2001(12)
硕士论文
[1]基于机器学习的重症监护病患死亡率预测[D]. 张英凯.电子科技大学 2018
本文编号:3608189
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
k近邻算法原理图
电子科技大学硕士学位论文14图2-2支持向量机分类原理图如图2-2所示,wx+b=0即为分离超平面,对于线形可分的数据集来说,几何间隔最大的分离超平面只有一个。支持向量机算法即在产生的无数个可分类超平面中寻找几何间隔最大的超平面,达到对样本最好的分类效果。标准的支持向量机算法是一种二分类模型,其学习策略即为间隔最大化。即min12‖‖22.(+)≥1(=1,2,…)(2-1)然而在标准支持向量机中有一对矛盾体,即最大间隔和最小训练误差,于是提出了软间隔支持向量机,软间隔支持向量机的基本思想是对训练集中的每一个样本引入一个松弛变量,使间隔大于等于1,即(+)≥1。并且引入一个惩罚参数,惩罚参数越大对误分类的惩罚越大。使用软间隔最大化可以解决带有异常点的分类问题。2.2.3多层感知机算法多层感知机(MultilayerPerceptron,MLP)又名人工神经网络(ArtificialNeuralNetwork,ANN)[21,22],其结构为输入层,隐藏层,输出层。最简单的多层感知机只有一个隐藏层,多层感知机基本结构如下图。
第二章数据统计及模型认识15图2-3多层感知机模型结构图从图中可以看到,多层感知机每个层之间为全连接的,一开始是输入层,中间是隐藏层,最后是输出层。假设输入为={1,2,3,,},输出为(1+),1为权重,b为偏置,函数f常用sigmoid或者tanh函数。多层感知机的每一个节点即为一个感知器,当信号从输入层被传入时,进入隐藏层,隐藏层节点根据传入的信号进行计算,将计算后的结果传入下一层,最后从输出层输出结果。多层感知机的训练过程即为寻找最佳的权重和偏置等参数使得模型能够最好地拟合数据。2.2.4随机森林算法上世纪八十年代Breiman等人发明了决策树算法,决策树算法通过不断二分类数据进行分类或回归。2001年Breiman把决策树组合为随机森林(RandomForest,RF)[23-25],随机森林是一种Bagging算法的变体,是在以决策树为基学习器构建Bagging集成的基础上,进一步在决策树的训练过程中引入随机属性选择的方法。随机森林是随机化变量提取和数据提取,生成很多无关联的决策树,每一个决策树都是一个弱分类器,最后汇总所有决策树的结果。随机森林算法在没有显著提高计算量的前提下提高了预测精度。下图为随机森林算法结构图。
【参考文献】:
期刊论文
[1]深度学习的可解释性[J]. 吴飞,廖彬兵,韩亚洪. 航空兵器. 2019(01)
[2]国内电子病历发展与应用现状分析[J]. 马锡坤,杨国斌,于京杰. 计算机应用与软件. 2015(01)
[3]急性心肌梗死患者入院时心率水平与死亡率相关性分析[J]. 罗建华,黄征. 浙江中西医结合杂志. 2009(02)
[4]APACHEⅡ与SAPSⅡ评分系统对急诊内科危重患者病情评估价值的比较[J]. 孟新科,邓跃林. 中国危重病急救医学. 2001(12)
硕士论文
[1]基于机器学习的重症监护病患死亡率预测[D]. 张英凯.电子科技大学 2018
本文编号:3608189
本文链接:https://www.wllwen.com/shoufeilunwen/mpalunwen/3608189.html
最近更新
教材专著