当前位置:主页 > 医学论文 > 生物医学论文 >

基于机器学习的重症监护病患死亡率预测

发布时间:2020-03-24 20:24
【摘要】:目前针对肝脏系统功能障碍相关病患的死亡率预测主要使用的方式是通过Apache评分系统进行死亡率预测,相关样本集的提取也以该评分系统的评分表为标准,该方法适用病患群体广、需要的样本数量也低,广泛应用于国内外的重症监护室。本文不同于围绕Apache评分系统进行样本集构建的研究,直接提取MIMICIII与飞利浦eICU协作数据库中的病患数据,通过样本特征筛选、缺失值处理、数据标准化等过程,使得得到的数据维度更高、缺失值更少,针对肝脏系统功能障碍相关病患的死亡预测率也更高。由于数据样本特征的复杂性,结合人工选取与方差对比的方式对样本特征进行了初步筛选。针对样本集中的缺失值部分,我们通过样本特征基尼重要性的分析,选择在MIMIC-III样本集上使用中值填补缺失值,而在eICU样本集上使用众数填补缺失值。在对数据进行标准化后,使用主成分分析(PCA)对样本集样本特征进行了降维处理,并对比了降维前后的样本集训练出的预测模型效果,结果证明未经降维的样本集更具优势。接下来我们使用随机森林、支持向量分类、多层感知器神经网络等机器学习方法,分别在MIMIC-III样本集与e ICU样本集上实现了样本的肝脏系统功能预测、死亡率预测以及肝脏系统功能障碍样本的死亡率预测。同时,为了确认预测模型的稳定性与泛化能力,引入了召回率、f1分数等模型评价指标,对不同样本集下的多种算法模型逐一分析。这里为了验证本文研究方法的有效性,我们对比了使用Apache-IV评分系统进行死亡率预测的效果,发现本文所使用的机器学习算法预测正确率更高。在对预测模型分析的过程中,通过样本特征的基尼重要性对比,我们发现部分样本特征在病患死亡率预测中表现出较高的重要性。同时,对比原始样本集,肝脏系统功能障碍样本集进行死亡率预测时,负离子间隙(Anion gap)表现出更高的基尼重要性,而在去除负离子间隙这项特征后,肝脏系统功能障碍样本集的死亡预测正确率出现了下滑,这表明负离子间隙与肝脏系统功能障碍间存在潜在的联系。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R318.0;TP181

【相似文献】

相关期刊论文 前10条

1 李炜;;机器学习概述[J];科技视界;2017年12期

2 朱辉;;机器学习在企业级场景中的实践与探讨[J];中国建设信息化;2018年03期

3 彭传意;;机器学习——我们该如何与机器竞争[J];数字通信世界;2018年01期

4 陈轶翔;埃里克·布伦乔尔森;汤姆·米切尔;;机器学习的能力范围及其对劳动力的影响[J];世界科学;2018年04期

5 赵长林;;机器学习即服务[J];网络安全和信息化;2017年10期

6 ;机器学习作用于信息安全的五大顶级案例[J];网络安全和信息化;2018年01期

7 吴承杨;;2018年来说说机器学习[J];软件和集成电路;2018年05期

8 徐林;;基于机器学习思想的非线性方程组求解[J];黑龙江工程学院学报;2016年06期

9 ;《软件学报》复杂环境下的机器学习研究专刊征文通知[J];软件学报;2017年01期

10 ;机器学习如何助力安全[J];计算机与网络;2017年06期

相关会议论文 前10条

1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年

2 张长水;;大数据机器学习[A];2015年中国自动化大会摘要集[C];2015年

3 何琳;侯汉清;;基于标引经验和机器学习相结合的多层自动分类[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

4 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

5 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年

6 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

7 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

8 陈翠云;刘志宇;宫月;;基于机器学习的网络入侵检测模型及方法研究[A];第六届全国网络安全等级保护技术大会论文集[C];2017年

9 朱焕;胡祥杰;;2016机器学习三大趋势:算法经济将引导人工智能走向何方?[A];《科学与现代化》2017年第1期(总第070期)[C];2017年

10 刘铸樘;;互联网+背景下机器学习法在体育中的应用[A];2016年第十二届全国体育信息科技学术大会论文摘要汇编(数字体育研究)[C];2016年

相关重要报纸文章 前10条

1 360 IoT研究院院长 李康;从机器学习到机器创造[N];中国信息化周报;2017年

2 谢静;机器学习帮助用户释放数据价值[N];人民邮电;2018年

3 Mary Branscombe 编译 范范;关于机器学习的9大误区[N];计算机世界;2018年

4 张盖伦;机器学习界所抵制的,是旧的知识分享方式[N];科技日报;2018年

5 外语教学与研究出版社基础教育分社综合产品部编辑部副主任 张世钦;机器学习赋能编辑出版[N];中国出版传媒商报;2018年

6 本报记者 杨博;苹果呼吁放宽自动驾驶测试限制[N];中国证券报;2016年

7 ;大数据未来十大发展趋势[N];中国信息化周报;2016年

8 卫人;中国人工智能历史元年,,一切才刚刚开始[N];中国经济导报;2016年

9 ;机器学习是否等同于人工智能[N];中国信息化周报;2016年

10 本报记者 何晓亮;工具开放:开启人工智能“全民时代”[N];科技日报;2016年

相关博士学位论文 前10条

1 张庆庆;基于机器学习的文本情感分类研究[D];西北工业大学;2016年

2 鲁路;基于机器学习优化分子对接筛选肾衰营养胶囊有效成分[D];南方医科大学;2017年

3 王泉德;机器学习及其在多Agent对策学习中的应用研究[D];武汉大学;2005年

4 翁时锋;基于机器学习的几种医学数据处理方法研究[D];清华大学;2005年

5 范玉刚;基于Kernel的机器学习在建模与分类问题的应用研究[D];浙江大学;2006年

6 蒋刚;核机器学习方法若干问题研究[D];西南交通大学;2006年

7 李智;机器学习方法及其在基金项目评审中的应用研究[D];天津大学;2004年

8 张义荣;基于机器学习的入侵检测技术研究[D];国防科学技术大学;2005年

9 刘章林;基于机器学习的编译优化适应性研究[D];中国科学院研究生院(计算技术研究所);2006年

10 何清;机器学习与文本挖掘若干算法研究[D];中国科学院研究生院(计算技术研究所);2002年

相关硕士学位论文 前10条

1 王爽;基于机器学习的花卉识别算法的研究与实现[D];电子科技大学;2018年

2 任高山;基于微信公众平台的文本情感分析研究[D];南昌航空大学;2018年

3 刘玲;蛋白质—核酸界面丙氨酸突变效应数据库与热点残基研究[D];安徽大学;2018年

4 张英凯;基于机器学习的重症监护病患死亡率预测[D];电子科技大学;2018年

5 刘鑫;机器学习研究及其在生存分析中的应用[D];电子科技大学;2018年

6 唐林;天数机器学习一体机系统的设计与实现[D];南京大学;2018年

7 张磊;基于机器学习的情感分析方法研究[D];电子科技大学;2018年

8 张为金;基于机器学习的电力异常数据检测[D];电子科技大学;2018年

9 颜欢;基于机器学习的AGV货物分拣系统研究与设计[D];武汉纺织大学;2018年

10 Lavocier K.Smith,Jr.;[D];湖南大学;2017年



本文编号:2598814

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/swyx/2598814.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c0556***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com