当前位置:主页 > 医学论文 > 医卫管理论文 >

随机效应-最大期望回归树模型在医学系统结构数据中的应用及模型评价

发布时间:2020-05-08 03:53
【摘要】:目的:在医学研究中,对于存在系统结构特征的实际资料,往往采用混合线性模型进行效应估计,但是对于进一步探索患者亚组与治疗方式间复杂的(高阶)交互作用时则效率较低。而决策树模型作为数据挖掘方法中的一种预测模型,具有较强的探索性能,可以同时分析多个预测变量,并且可以自动检测预测变量之间潜在的关系,对于医学疗效评价具有重要的意义。但是对于系统结构数据,传统CART回归树模型估计效率低下,模型构建准确性较低,偏倚较大。因此提高回归树模型的拟合效果及预测性能是将其应用在医学系统结构数据的重要前提。随机效应-最大期望回归树模型(Random Effect-Expectation Maximization Regression Tree,RE-EM)基于回归树模型和混合线性模型的思想,将随机效应从系统结构数据中分离出来,从而提高回归树模型构建的准确性与预测性能。本研究旨在介绍并验证随机效应-最大期望回归树模型的原理,并通过模拟实验与传统CART回归树模型进行横向对比。同时,基于慢性乙型肝炎初治患者诊疗的真实数据进行实证分析及模拟实验,进一步评价RE-EM回归树模型在不同数据结构下的拟合效果及预测性能,为更精准的医学疗效评价和回归树模型构建提供方法学支持和模型选择,为患者诊疗和干预提供方法学建议。方法:第一部分,设置随机效应及残差协方差结构,生成三个终端节点的回归树模型模拟数据,分别拟合RE-EM回归树模型与CART回归树模型,进而评价两种回归树模型在准确性和偏倚方面的优劣,验证RE-EM回归树模型对拟合系统结构数据的适用性。第二部分,基于临床HIS数据中的慢性乙型肝炎初治患者的抗病毒治疗信息,分别拟合一般线性模型、混合线性模型、CART回归树模型以及RE-EM回归树模型,进行抗病毒疗效评估。第三部分,基于四种模型的慢乙肝抗病毒疗效分析结果,探索不同参数(样本量、时间点、残差相关性、底层模型)条件下,RE-EM回归树模型的拟合效果及预测性能。如设定研究对象样本量为50、100、200、500、1000,对应时间点10、20、50、100。预测性能评价分为两部分:(1)预测研究对象新观测,以研究对象前70%的观测作为训练集,分别拟合四种模型,剩余的30%作为测试集,进行模型预测性能评价;(2)预测新研究对象,以70%的研究对象作为训练集,分别拟合四种模型,剩余的30%作为测试集,进行模型预测性能评价。结果:第一部分结果显示,在模型构建的准确性和拟合偏倚上,RE-EM回归树模型的表现优于CART回归树模型。在不同数据结构下,RE-EM回归树模型均能准确构建假定的回归树模型,而CART回归树模型对于系统结构数据的拟合效果则不理想,MSE值较大,无法准确构建假定的回归树模型。第二部分结果显示,在拟合适配度和偏倚上,混合线性模型的表现优于一般线性模型。在基于一般线性模型的慢乙肝患者疗效分析中,时依性ALT水平对结局定量HBV DNA检测值的影响差异有统计学意义,而考虑了随机效应及残差协方差结构的混合线性模型则无该关系。在回归树模型的分析中,RE-EM回归树模型的MSE值最小,为0.8048,低于一般线性模型、混合线性模型及CART回归树模型。第三部分结果显示,在模型拟合效果评价中,当线性模拟数据不含随机效应时,线性模型拟合效果优于回归树模型,而对于非线性数据,回归树模型的拟合效果则明显优于线性模型,其中RE-EM回归树模型的拟合效果与CART回归树模型相近。当模拟数据为系统结构数据时,混合线性模型与RE-EM回归树模型的拟合效果相近,优于一般线性模型和CART回归树模型。综合各种情况,RE-EM回归树模型拟合效果较好,优于CART回归树模型。在模型预测新观测的性能评价中,对于具有系统结构特征的线性模拟数据,线性模型预测新观测的性能明显优于回归树模型,其中RE-EM回归树模型的预测性能优于CART回归树模型。对于具有系统结构特征的非线性模拟数据,RE-EM回归树模型与混合线性模型预测新观测的性能最优,明显优于CART回归树模型,一般线性模型拟合效果最差。综合各种情况,RE-EM回归树模型预测新观测的性能较好,优于CART回归树模型。在模型预测新对象的性能评价中,当线性模拟数据不存在系统结构特征时,线性模型预测新对象的性能优于回归树模型,当非线性模拟数据不存在系统结构特征时,回归树模型预测新对象的性能优于线性模型,与前述情况一致。而对于系统结构数据,RE-EM回归树模型预测新对象的性能始终最优。综合各种情况,RE-EM回归树模型预测新对象的性能较好。结论:对于系统结构数据,RE-EM回归树模型能够有效地识别预测变量间潜在的联系,提高模型的拟合效果,体现了RE-EM回归模型在系统结构数据中的适用性与可行性。从回归树模型的建模过程中可以看出,与线性模型相比,树模型是由根节点到终端节点的路径组成,类似于人的决策形式,其结果直观简洁具有较强的解释性。在本研究中,通过模拟实验和慢乙肝抗病毒疗效评估,验证了RE-EM回归树模型对于医学系统结构数据分析的有效性。RE-EM回归树模型对于系统结构数据的拟合效果及预测性能均优于CART回归树模型。对于线性系统结构数据,RE-EM回归树模型预测新对象的性能接近甚至优于混合线性模型。
【图文】:

回归树,药科大学,指示变量


广东药科大学硕士研究生毕业论文 ( ) ∑ д ) 式(中 为每个叶节点的预测值。 为指示变量,取值为 0 或 1。 , 征空间或终端节点,若自变量属于哪一特征空间则 ,即取相应

模型图,回归树,特征空间,模型


图 2-2 特征空间划分研究中构建的 CART 回归树模型以及 RE-EM 回归树模型,,均及 REEMtree 包中的默认设置,具体定义如下:生长深度(the maximum depth),指的是决策树模型的生长点且不为空,则深度为 1,在本研究中设定为 30;参数(complexityparameter,cp),指的是决策树模型每生长的减少量,在本研究中设定最小 cp 值为 0.01,即当模型相于 0.01,则树停止生长;验证(cross validations, CV),在本研究中,采用 k 折交叉验ations)进行回归树模型生长,其思想为将数据随机分为 k 份训练集,余下的作为测试集,进行 k 次模型拟合,求得每方残差的平均值,在本研究中 k 折交叉验证设定为 10 折;树模型的剪枝采用目前应用较为广泛的 1-SE 规则,此规则(通过交叉验证获得)尽量小,但不一定取最小值,而是允+一个相应标准差”的范围内, 并在此范围内选取尽量小的复
【学位授予单位】:广东药科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:O212.1;R195.1

【相似文献】

相关期刊论文 前10条

1 李伟南;林畅琪;廖海宁;潘敏仪;郜艳晖;周舒冬;;随机效应-最大期望回归树模型的模拟研究与评价[J];中国卫生统计;2019年05期

2 肖静;许琼琼;高月霞;仲亚琴;吴徐明;强福林;沈康;;基于回归树模型的乳腺癌住院费用病例组合研究[J];中国卫生统计;2016年05期

3 佘玉萍;陈淑清;;基于增强回归树的水藻预测分析[J];长春大学学报;2015年06期

4 徐鲁雄;谢超凡;徐琳;;基于回归树模型的教师评价分析——以福建师范大学福清分校为例[J];太原师范学院学报(自然科学版);2015年03期

5 朱秋丽;张涛;丁云芳;张学兰;赵根明;;呼吸道合胞病毒感染儿童住院费用影响因素的回归树分析[J];复旦学报(医学版);2011年04期

6 莫春梅,倪宗瓒,高凤琼;回归树的建模与应用[J];中华预防医学杂志;2002年05期

7 黄德生;关鹏;郭军巧;王萍;周宝森;;沈阳市细菌性痢疾疫情分类回归树分析[J];中国医科大学学报;2008年03期

8 蔡杰;李洪涛;;按病种分值付费分值细分方法研究[J];中国卫生经济;2018年06期

9 刘澄;胡巧红;孙莹;;基于分类回归树的会计信息失真识别研究[J];中国管理信息化;2013年06期

10 杜志成;张王剑;于石成;郝元涛;;广东省手足口病气象危险因素阈值效应的研究[J];现代预防医学;2015年19期

相关硕士学位论文 前4条

1 李伟南;随机效应-最大期望回归树模型在医学系统结构数据中的应用及模型评价[D];广东药科大学;2019年

2 罗明宇;济南市部分城市社区老年人焦虑、抑郁状态影响因素回归树分析[D];山东大学;2016年

3 孟祥虎;基因表达预测模型研究[D];西安电子科技大学;2014年

4 陈秋艳;长江中下游地区树轮气候响应特征分析与区域冬春季温度的重建[D];兰州大学;2015年



本文编号:2654076

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2654076.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b07e5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com