当前位置:主页 > 医学论文 > 心血管论文 >

基于随机森林与logistic回归的高血压影响因素研究

发布时间:2023-05-14 03:56
  目的针对铜陵市天桥社区居民体检数据中多因素、有效样本有限的情况,挖掘与分析高血压影响因素与因素间的交互效应,为高血压干预提供参考。方法选取2017年该社区801例体检数据为研究对象,采用随机森林方法,筛选出重要性评分较大的特征,代入logistic完全二次回归模型,逐步回归分析影响因素及因素间的交互效应。结果随机森林模型准确率83.67%,特征重要性前10项为年龄、糖尿病、锻炼频率、体质指数、总胆固醇、吸烟情况、饮酒情况、中心性肥胖、甘油三酯、血尿素氨。Logistic完全二次回归模型准确率84.17%,输出2条主效应、8条二次交互效应。主效应中有统计学意义(P<0.05)的特征有年龄、锻炼频率,二次交互效应中有统计学意义(P<0.05)的特征有年龄、糖尿病、体质指数、总胆固醇、吸烟情况、饮酒情况、甘油三酯、血尿素氨。结论随机森林与logistic完全二次回归模型相结合,解决了经典方法难以从多因素、样本有限的数据中挖掘交互效应的问题,获得高血压影响因素与因素间的交互效应,为高血压干预提供有益的指导。

【文章页数】:4 页

【文章目录】:
1 材料与方法
    1.1 数据来源
    1.2 方法
        1.2.1 随机森林模型
        1.2.2 Logistic完全二次回归模型
2 结 果
    2.1 模型对比
    2.2 基于随机森林的特征筛选
    2.3 基于logistic回归完全二次模型分析
3 讨 论



本文编号:3817136

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/xxg/3817136.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e915b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com