基于最优子集法建立肠道准备预测模型的研究
发布时间:2021-02-17 02:11
目的基于最优子集法建立肠道准备预测模型,量化评估影响肠道准备的预测变量。方法选取2017年1月至2019年10月在广东省中医院总院消化内科行结肠镜检查的门诊及住院的患者。分别运用向前逐步和最优子集法在训练集中建立logistic回归模型,并在测试集中评估两个模型的ROC曲线下面积(area under the ROC curve,AUC)、净重新分类改善指数(net reclassification index,NRI)、综合判别改善指数(integrated discrimination improvement,IDI)等指标。结果研究共纳入了455例患者,其中病例组195例,对照组260例。经最优子集模型筛选出的4个预测变量为高纤维饮食、糖尿病、便秘史、术前活动,AUC值0.873(0.819~0.926)。两个模型间的AUC值、NRI、IDI均差异无统计学意义,但最优子集模型更为简洁。结论最优子集法模型能更简洁、有效地筛选出影响肠道准备的因素,根据这些因素建立的列线图能为医护人员提供有效的指导。
【文章来源】:中国实用内科杂志. 2020,40(03)北大核心
【文章页数】:6 页
【部分图文】:
基础模型与最优子集法模型的ROC曲线对比
目前国内外对于预测结肠镜检查前影响肠道准备危险因素的研究虽然比较多,但很多方面尚存争议。造成这个问题的原因,除了有研究设计的因素也有统计学层面的因素。影响肠道准备的危险因素数量众多,彼此间相互联系,当涉及研究的样本量不足或在建立统计学模型时没有处理好彼此间的影响时,很可能会得出截然不同的结论。本研究的基础模型采用向前逐步Logistic回归,这种算法先通过前向逐步回归添加特征,然后检查是否有特征不再对提高模型拟合度起作用,如果有则删除[10]。但是逐步回归技术会遇到非常严重的问题:对于一个数据集,你先用前向逐步回归,然后再用后向逐步回归,可能会得到两个完全矛盾的模型。最重要的一点是,逐步回归会使回归系数发生偏离[11]。为此,本研究采用了最优子集法建立新的模型进行对比。在最优子集回归中,算法使用所有可能的因素组合来拟合模型,选择BIC中最小的模型为最佳模型。但如果纳入的因素过多的话,因素组合也会大量增加,工作量就会非常大[12]。在单因素分析中(表1),我们可以观察到有13个预测变量是有显著统计学意义的,但经过多因素调整混杂因素后,在基础模型和最优子集模型则分别只有5个和4个预测变量有统计学意义。大部分研究认为,便秘是影响肠道准备的因素[13-14],而Cheng等[15]认为,便秘不是肠道准备差的危险因素。Yadlapati等[3]也认为,便秘不是危险因素,而较低的经济水平(OR 1.11;95%CI 1.04~1.22)、服用鸦片类药物或三环抗抑郁药(OR 1.55;95%CI 0.98~2.46)、在下午行结肠镜检查(OR 1.66;95%CI 1.07~2.59)是影响肠道准备差的危险因素。与许多文献的结论一样[16],本文的研究也认为,便秘是影响肠道准备的关键因素(OR 12.1;95%CI 6.018~24.329)。与其他研究不同的是,我们认为,便秘作为胃肠动力障碍的一种表现,可能与多种因素相关,例如长期使用阿片类药物、抗胆碱能药物,合并中风、糖尿病等。也就是说,便秘这个危险因素可能和多个因素有交互作用,当研究把这些因素都纳入分析时,可能会均摊降低了便秘的作用,从而低估了便秘的风险。本文的研究并没有纳入影响便秘的药物服用史,因而便秘的OR值比其他研究高。
本文编号:3037260
【文章来源】:中国实用内科杂志. 2020,40(03)北大核心
【文章页数】:6 页
【部分图文】:
基础模型与最优子集法模型的ROC曲线对比
目前国内外对于预测结肠镜检查前影响肠道准备危险因素的研究虽然比较多,但很多方面尚存争议。造成这个问题的原因,除了有研究设计的因素也有统计学层面的因素。影响肠道准备的危险因素数量众多,彼此间相互联系,当涉及研究的样本量不足或在建立统计学模型时没有处理好彼此间的影响时,很可能会得出截然不同的结论。本研究的基础模型采用向前逐步Logistic回归,这种算法先通过前向逐步回归添加特征,然后检查是否有特征不再对提高模型拟合度起作用,如果有则删除[10]。但是逐步回归技术会遇到非常严重的问题:对于一个数据集,你先用前向逐步回归,然后再用后向逐步回归,可能会得到两个完全矛盾的模型。最重要的一点是,逐步回归会使回归系数发生偏离[11]。为此,本研究采用了最优子集法建立新的模型进行对比。在最优子集回归中,算法使用所有可能的因素组合来拟合模型,选择BIC中最小的模型为最佳模型。但如果纳入的因素过多的话,因素组合也会大量增加,工作量就会非常大[12]。在单因素分析中(表1),我们可以观察到有13个预测变量是有显著统计学意义的,但经过多因素调整混杂因素后,在基础模型和最优子集模型则分别只有5个和4个预测变量有统计学意义。大部分研究认为,便秘是影响肠道准备的因素[13-14],而Cheng等[15]认为,便秘不是肠道准备差的危险因素。Yadlapati等[3]也认为,便秘不是危险因素,而较低的经济水平(OR 1.11;95%CI 1.04~1.22)、服用鸦片类药物或三环抗抑郁药(OR 1.55;95%CI 0.98~2.46)、在下午行结肠镜检查(OR 1.66;95%CI 1.07~2.59)是影响肠道准备差的危险因素。与许多文献的结论一样[16],本文的研究也认为,便秘是影响肠道准备的关键因素(OR 12.1;95%CI 6.018~24.329)。与其他研究不同的是,我们认为,便秘作为胃肠动力障碍的一种表现,可能与多种因素相关,例如长期使用阿片类药物、抗胆碱能药物,合并中风、糖尿病等。也就是说,便秘这个危险因素可能和多个因素有交互作用,当研究把这些因素都纳入分析时,可能会均摊降低了便秘的作用,从而低估了便秘的风险。本文的研究并没有纳入影响便秘的药物服用史,因而便秘的OR值比其他研究高。
本文编号:3037260
本文链接:https://www.wllwen.com/yixuelunwen/xiaohjib/3037260.html
最近更新
教材专著