基于电子病历时态数据的住院病人急性肾损伤风险预测
发布时间:2024-12-01 03:29
急性肾损伤(Acute Kidney Injury,AKI)是一种以肾功能急速减退为特征的临床综合症。每年我国有上百万人罹患这种疾病,而国际研究表明其死亡率超过五成。目前没有很好的治疗方法,早期诊断是关键。现有研究通过分析电子病历(Electronic Medical Record,EMR)中的诊断、治疗和保健等健康相关活动的数字记录,构建AKI预测模型。但是,上述研究没有考虑EMR中的时态信息,没有反映病人的用药行为和治疗效果,导致模型性能不佳。同时,EMR中正负样本的极度不平衡,使预测模型结果存在偏差。本文主要分为两部分研究AKI风险预测问题:首先,应用两种考虑时态信息的时态数据处理方法Stacked-Temporal和Multitask-Temporal来挖掘电子病历中的时态信息,提高AKI风险预测模型的性能。其次,本文采用了训练集划分模型集成的方法解决类非平衡问题,以提高正样本的预测准确率。通过案例研究发现,未经非平衡处理的情况下,Recall最高为0.57,F1值最高为0.29。采用训练集划分模型集成的方法时,Recall最高可达0.72,F1最高达0.33。说明经过非平衡处理...
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
本文编号:4013484
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图3-1训练集划分模型集成过程
20图3-1训练集划分模型集成过程集成方法的结果主要是通过投票(Voting)和加权确定。投票一般是针
图4-6数据处理过程示意图
图4-6数据处理过程示意图通过上面三种方法我们得到不同的数据集,利用卡方检验分别计算不同数据集中各个变量的卡方统计量和P值。P值表示当原假设成立时拒绝原假设的概率,是一个小概率事件的概率。在统计学中,认为当P值小于0.05我们认为具有显
图5-5ROC曲线图
图5-5ROC曲线图出,曲线越偏往左上方则模型分类效果越好。reaUnderCurve)被定义为ROC曲线下的面积,其值要用到AUC是因为ROC曲线不能明确的对分类器
本文编号:4013484
本文链接:https://www.wllwen.com/yixuelunwen/mjlw/4013484.html
最近更新
教材专著