当前位置:主页 > 医学论文 > 预防医学论文 >

乌鲁木齐市成人2型糖尿病发病风险模型的建立与评估

发布时间:2020-07-28 12:06
【摘要】:目的:建立乌鲁木齐市成人2型糖尿病发病风险模型并进行评估。方法:采用随机整群抽样的方式在乌鲁木齐市米东区和新市区分别抽取A社区卫生服务中心(A社区)和B社区卫生服务中心(B社区),于2018年7月至2019年1月分别在A社区和B社区招募年龄为35~74岁居民并进行问卷调查、体格测量、体脂检测和实验室检测。以A社区的研究数据作为训练集,在训练集中分别运用单因素Logistic回归和随机森林算法筛选变量,再应用多因素Logistic回归建立糖尿病发病风险模型,采用十折交叉验证对模型进行内部验证,再用B社区居民的研究数据对建立的糖尿病发病风险模型进行外部验证,通过受试者工作特征曲线下面积(AUC)和统计学检验模型预测值和实际观测值间的差异来分别评价模型的区分度和校准度。结果:在A社区和B社区最终分别招募1221名和1004名研究对象。通过B社区居民的研究数据对单因素logistic回归筛选变量后用多因素logistic回归(方法一)建立的糖尿病发病风险模型进行评估,其灵敏度为70.1%,特异度为64.6%,预测一致率为65.4%,AUC为0.717,95%CI(0.672,0.761);通过B社区居民的研究数据对随机森林算法筛选变量后用多因素logistic回归(方法二)建立的糖尿病风险预测模型进行评估,其灵敏度为70.1%,特异度为60.9%,预测一致率为62.4%,AUC为0.708,95%CI(0.664,0.749),两种预测方法AUC的差异无统计学意义,即两种预测方法的区分度无差别,区分度均较高。两种预测方法各自糖尿病发生的预测值和实际观测值的差异经Hosmer-Lemeshow(H-L)检验发现均无统计学意义,即两种预测方法均有良好的校准度;从模型预测值和实际观测值间的关系图上可同样看出,两种预测方法各自的校准度较好。结论:通过方法一和方法二建立的糖尿病发病风险模型,具有较高的预测效能,两种预测方法都具有较高的区分度和良好的校准度。
【学位授予单位】:新疆医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R587.1;R181.3
【图文】:

糖尿病,森林,风险预测,算法分析


变量平均重要性得分(分)图 1 糖尿病风险预测随机森林算法分析结果变量平均重要性Figure1 Analysis results of random forests algorithm for diabetes mellitus risk prediction.5.2 随机森林算法筛选变量运用随机森林算法筛选 A 社区 1221 名研究数据库中糖尿病相关的变量,得

数据分类,错误率,森林


图 2 逐步随机森林袋外数据分类错误率图Figure2 Classification error rate chart of stepwise random forests out of bag data1.6 多因素 Logistic 回归分析随机森林算法筛选出的糖尿病家族史、高血压、血清肌酐、年龄、咸菜泡菜和新鲜瓜果摄入频率等 25 个变量作为自变量,以是否患糖尿病(赋值:是=1,否=0

曲线,筛选变量,多因素,森林


32图 4 多因素 Logistic 回归的 ROC 曲线(随机森林算法回归筛选变量)e4 ROC curve of multivariate logistic regression model(random forests alscreening variables)

【相似文献】

相关期刊论文 前10条

1 沈智勇;苏

本文编号:2772859


资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/2772859.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fb3f5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com