当前位置:主页 > 医学论文 > 医卫管理论文 >

基于不完备医疗数据的疾病风险预测研究

发布时间:2021-10-18 18:20
  我国医疗数字化体系经过十年的大规模建设,积累了大量的电子健康记录,这为疾病风险预测研究提供了丰富的数据基础。然而,这些医疗数据中存在着严重的数据缺失问题,即数据在收集或者保存时由于主客观等因素所产生的数据值缺失或者属性缺失,从而丢失系列信息和知识。目前,缺乏对于这种数量化及结构化的医疗数据进行学习的有效方法。疾病风险预测所采用的深度学习模型,多数不能提供模型内部的运行机制和解释,而疾病诊断和临床决策需要模型提供充分合理的证据支持。此外,传统医疗诊断很大程度上依靠医生的经验和领域知识,为使医生在与机器交互的过程中迅速积累经验,补充知识的不足,模型需提供判断的依据。因此,如何结合深度模型的优良性能,同时增强预测模型的可解释性,也需要做进一步的研究。针对上述问题,本文提出了一种适用于疾病风险预测的模拟学习方法,采用谱正则化方法对不完备的医学数据进行学习及填充。谱正则化方法可以准确地对原始数据的遗漏进行估测并且加以填充,该方法能够处理大规模的矩阵并利用问题和数据自身结构。经实验证明,在缺乏特定领域知识或领域专家标注的情况下,该方法可以获得高质量的填充数据并有效降低对后续算法所产生的累计误差。在... 

【文章来源】:东北师范大学吉林省 211工程院校 教育部直属院校

【文章页数】:45 页

【学位级别】:硕士

【部分图文】:

基于不完备医疗数据的疾病风险预测研究


不同特征属性的患者数量分布

分布情况,特征属性,患者


图 5.2 不同患者的特征属性数分布横坐标代表病人数量,纵坐标为特征数量的病情可以通过肿瘤分期进行监测,由基于 PTNM,其中每个水平还包括原发性肿瘤,区域性淋巴结转表 5.1 肿瘤阶段及患者比例 Level Ⅰ Level Ⅱ Level Ⅲ Le占比 76% 2% 13% 9%索硬化数据硬化数据(PRO-ACT)①,包括参与临床试验的 85其中 6842 名患者的数据进行风险预测。PRO-ACT 中为不同的数据文件涉及 ALSFRS 功能量表,死亡报验,实验室研究数据,利鲁唑(药物)使用,慢速过程和生命体征。原始数据患者及属性分布情况见

数量分布,数量分布,患者,特征数


图 5.3 不同特征属性的患者数量分布横坐标代表特征数量,纵坐标为病人数量图 5.4 不同患者的特征属性数分布横坐标代表病人数量,纵坐标为特征数量可以通过功能评定量表(ALSFRS)监测,其中涉peech, Q2_Salivation, Q3_Swallowing, Q4_Handwriy, Q5b_Cutting with Gastrostomy, Q6_Dressingd, Q8_Walking, Q9_Climbing Stairs, Q10_Respirato

【参考文献】:
硕士论文
[1]我国P2P网络借贷的金融风险与监管对策[D]. 白雪.湖南大学 2017
[2]基于谱正则化算法的矩阵完备化及其应用的研究[D]. 闫利霄.燕山大学 2015



本文编号:3443263

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3443263.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户83dde***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com