基于随机森林与logistic回归的高血压影响因素研究
发布时间:2023-05-14 03:56
目的针对铜陵市天桥社区居民体检数据中多因素、有效样本有限的情况,挖掘与分析高血压影响因素与因素间的交互效应,为高血压干预提供参考。方法选取2017年该社区801例体检数据为研究对象,采用随机森林方法,筛选出重要性评分较大的特征,代入logistic完全二次回归模型,逐步回归分析影响因素及因素间的交互效应。结果随机森林模型准确率83.67%,特征重要性前10项为年龄、糖尿病、锻炼频率、体质指数、总胆固醇、吸烟情况、饮酒情况、中心性肥胖、甘油三酯、血尿素氨。Logistic完全二次回归模型准确率84.17%,输出2条主效应、8条二次交互效应。主效应中有统计学意义(P<0.05)的特征有年龄、锻炼频率,二次交互效应中有统计学意义(P<0.05)的特征有年龄、糖尿病、体质指数、总胆固醇、吸烟情况、饮酒情况、甘油三酯、血尿素氨。结论随机森林与logistic完全二次回归模型相结合,解决了经典方法难以从多因素、样本有限的数据中挖掘交互效应的问题,获得高血压影响因素与因素间的交互效应,为高血压干预提供有益的指导。
【文章页数】:4 页
【文章目录】:
1 材料与方法
1.1 数据来源
1.2 方法
1.2.1 随机森林模型
1.2.2 Logistic完全二次回归模型
2 结 果
2.1 模型对比
2.2 基于随机森林的特征筛选
2.3 基于logistic回归完全二次模型分析
3 讨 论
本文编号:3817136
【文章页数】:4 页
【文章目录】:
1 材料与方法
1.1 数据来源
1.2 方法
1.2.1 随机森林模型
1.2.2 Logistic完全二次回归模型
2 结 果
2.1 模型对比
2.2 基于随机森林的特征筛选
2.3 基于logistic回归完全二次模型分析
3 讨 论
本文编号:3817136
本文链接:https://www.wllwen.com/yixuelunwen/xxg/3817136.html
最近更新
教材专著