随机森林算法在产后抑郁风险预测中的应用
发布时间:2024-05-17 19:38
目的:探讨随机森林算法在产后抑郁影响因素的筛选和风险预测中的应用效果。方法:选取2017年6月至2018年6月在湖南省长沙市某三甲医院接受产前检查并在该医院分娩,符合纳入和排除标准的孕早期妇女为研究对象。入组时,使用自编的调查问卷、中文版爱丁堡产后抑郁量表(Edinburgh Postnatal Depression Scale,EPDS)调查研究对象的人口经济学、心理社会学、生物学和产科及其他特征;产后4~6周内,采用中文版EPDS进行抑郁评分和自编的产后资料问卷收集分娩和产后资料。采用R软件在训练数据集上建立产后抑郁风险预测的随机森林模型,在验证数据集上采用预测准确率、灵敏度、特异度、阳性预测值、阴性预测值和曲线下面积(area under curve,AUC)评价模型的预测效果。结果:共调查406例研究对象,其中150例的EPDS得分≥9,产后抑郁的发生率为36.9%。通过随机森林算法对训练集建立的模型在验证集上验证,得出预测准确度为80.10%,灵敏度为61.40%,特异度为89.10%,阳性预测值为73.00%,阴性预测值为82.80%,AUC值0.833。采用随机森林算法通...
【文章页数】:8 页
【部分图文】:
本文编号:3975960
【文章页数】:8 页
【部分图文】:
图1PPD风险预测的随机森林模型建立过程
随机森林算法在应用过程中得到的主要结果为变量的重要性评分,其目的是对解释变量在结局发展中的重要性进行评价[5]。对测试样本中的变量进行重新排列,对重新排列前后出现的误差率进行再次计算,比较两个误差率之间是否存在差值,差值即为每棵树的重要评分标准。在随机森林模型的建立过程中,结局变....
图2PPD风险预测的随机森林模型训练集和验证集上ROC曲线
以随机森林模型预测精度的平均下降量对PPD随机森林模型的总体变量重要性评分进行排序,排在前10位的重要预测变量为:产前抑郁、产后经济担忧程度、产后工作担忧程度、FT3孕早期、HDL孕晚期、向婴幼儿发脾气、TCHOL孕早期、TG孕早期、Hct孕晚期、TG孕晚期(表2)。3讨论
本文编号:3975960
本文链接:https://www.wllwen.com/yixuelunwen/fuchankeerkelunwen/3975960.html
最近更新
教材专著