当前位置:主页 > 硕博论文 > 医学博士论文 >

基于有限数据的临床预测模型研究

发布时间:2021-06-12 04:55
  随着信息技术的高速发展和医院信息系统的日益普及,患者的临床资料得以电子化记录和存储。这些临床数据能够反映患者的身体状况,为患病严重程度评估和疾病风险预测提供重要依据。临床预测模型是基于医学数据利用机器学习技术建立的疾病诊断和预测工具,能够为医生诊断病情、制定治疗管理方案以及进行医学研究提供科学依据和决策支持,具有重要的应用价值。但在临床实践中,医学样本往往数量较少且数据不完整,容易导致机器学习算法过拟合、预测误差大、不稳定,限制了临床预测模型的性能。针对上述问题,本论文研究了有限医学数据条件下预测模型的构建方法,以提升模型的预测性能,促进临床预测模型在实践中发挥切实有效的作用。本论文主要完成了以下工作:(1)针对医学数据缺失的问题,建立了自适应加权投票随机森林(Adaptive weight voting random forest,AWVRF)算法。当树节点变量缺失时,该算法允许被处理的样本在当前节点上退出并根据所涉及变量的强度调整投票权重,通过加权投票做出最终决策。采用10个UCI标准数据集对该算法进行测试,结果表明AWVRF的正确率和AUROC指标优于现行的补缺策略决策算法mea... 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:121 页

【学位级别】:博士

【部分图文】:

基于有限数据的临床预测模型研究


图2.2典型RNN模型??

模块图,模块,技术基础,展开图


?第2章临床预测模型技术基础???v?输出层??图2.2典型RNN模型??9?yt-i?9t?yt+i??o?o?o?o??v?v?v?v??h?_?/if_i?ht?hf+i??u?u?u?u??X?Xt_i?xt?xt+1??图2.3典型RNN模型的展开图??图2.4展示了?RNN中重复模块的结构。??ht??r?、??tanh?ht??Tl^r??Xt??图2.4?RNN中重复模块的结构??第f个时刻重复模块的输出为??21??

结构图,结构图,符号,隐藏层


?浙江大学博士学位论文???输出门这3种门控开关,可分别处理不同的信息:遗忘门负责去除不再需要的信??息;输入门负责添加有用信息至记忆单元;输出门负责控制输出。由于遗忘门、??输入门和输出门以及记忆单元的设计,LSTM能够胜任保留和更新长距离信息的??任务。??ht????人■?-W?ct??fL?XX?0trl??xt??图2.7?LSTM结构图??LSTM?模块的输入是Xt。由公式(2-10)、(2-11)、(2-12)、(2-13)和(2-14)分别计??算得到当前时刻的遗忘门A、输入门it、候选值G、细胞状态&和输出门ot。再通??过公式(2-15)计算可得第/个时刻隐藏层的输出/it。??ft?=?a(wr[ht^,Xt]?+?bf)?(2-10)??it?=?〇-(^i?■?[ht-vXt]?+?bi)?(2-11)??Ct?-?tanh(wc?■?+?bc)?(2-12)??Ct?=?ft*?Q-1?+?it*Ct?(2-13)??〇t?=?〇-(w〇?■?[h^Xt]?+?b〇)?(2-14)??ht?=?ot?*?tanh{Ct)?(2-15)??在这些公式中,和匕是模型的权重和偏置参数,是上一时刻隐藏层的??输出,Cm是上一时刻细胞状态。符号?代表矩阵乘法(Matrixmultiplication),??而符号*代表元素积(Element-wise?product)。符号a代表sigmoid函数,符号??tan/i代表hyperbolic?tangent函数,其具体形式如公式(2-16)和(2-17)所不。??a(z)?=?_??-眷?g?(2-17)??

【参考文献】:
期刊论文
[1]临床预测模型:基本概念、应用场景及研究思路[J]. 谷鸿秋,周支瑞,章仲恒,周权.  中国循证心血管医学杂志. 2018(12)
[2]基于临床数据集的缺失值处理方法比较[J]. 李琳,杨红梅,杨日东,胡珊,张学良,周毅.  中国数字医学. 2018(04)
[3]重症监护室住院死亡风险的预测方法研究[J]. 谢俊卿,蔺轲,孔桂兰.  计算机工程与应用. 2017(20)
[4]基于随机森林的乳腺肿瘤细针穿刺辅助诊断[J]. 孙伟,张俊升,邢培锐.  计算机应用. 2015(S2)
[5]常用分类算法在不同样本量和类分布的不平衡数据中的分类效果比较[J]. 袁联雄,佘玲玲,林爱华,骆福添.  中国医院统计. 2015 (01)
[6]数据缺失的类型和处理方法及其在医学中的应用[J]. 黄光炜.  中国医院统计. 2013 (03)
[7]临床研究中缺失值的类型和处理方法研究[J]. 唐健元,杨志敏,杨进波,黄钦,吴春芳,冯毅.  中国卫生统计. 2011(03)
[8]有限样本下中文垃圾邮件过滤的研究与实现[J]. 张洪胜,耿焕同,喻为民.  计算机应用与软件. 2008(01)
[9]几种不同缺失值填充方法的比较[J]. 刘星毅,农国才.  南宁师范高等专科学校学报. 2007(03)
[10]小样本机器学习算法的特性分析与应用[J]. 辛宪会,叶秋果,滕惠忠,郭思海,李军,张靓,韩晓宏.  海洋测绘. 2007(03)

博士论文
[1]迁移学习问题与方法研究[D]. 龙明盛.清华大学 2014
[2]数据挖掘中分类分析的策略研究及其生物医学应用[D]. 张超.南方医科大学 2008

硕士论文
[1]不完全数据的处理方法及其在医学研究中的应用[D]. 李树威.重庆医科大学 2014
[2]机器学习中的特征选择算法研究[D]. 姜百宁.中国海洋大学 2009
[3]基于实例和特征的迁移学习算法研究[D]. 戴文渊.上海交通大学 2009
[4]数据仓库中数据质量控制问题研究[D]. 熊霞.武汉大学 2004



本文编号:3225989

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/yxlbs/3225989.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户788c9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com