Logistic回归变量筛选及回归方法选择实例分析
发布时间:2017-06-27 14:07
本文关键词:Logistic回归变量筛选及回归方法选择实例分析,,由笔耕文化传播整理发布。
【摘要】:目的探讨多因素Logistic回归分析中自变量筛选及逐步回归方法选择应注意的问题。方法针对冠心病危险因素病例对照调查数据(年龄X_1、高血压史X_2、高血压家族史X_3、吸烟X_4、高血脂史X_5、动物脂肪摄入X_6、体重指数X_7、A型性格X_8、冠心病Y),采用6种逐步回归变量筛选方法,进行多因素Logistic回归分析,比较不同方法筛选危险因素的差异性。结果单因素分析可见,冠心病组与非冠心病组的年龄分布无明显差异(P=0.116),而多因素Logistic回归分析显示,相对于65岁以上人群,低年龄组为保护因素[OR45=0.100,(0.000,0.484),P=0.020;OR45~54=0.051,(0.003,0.975),P=0.048]。将年龄定义为分类变量进行分析,筛选出的冠心病危险因素为动物脂肪摄入X_6、A型性格X_8、高血压史X_5和年龄X_1(P0.05);同时将年龄X_1当作连续性变量进行分析,结果显示年龄X_1无统计学意义(P=0.053)。6种逐步回归变量筛选方法得到的共同的危险因素是动物脂肪摄入X_6、A型性格X_8;向前-条件、向前-LR、向前-Wald法另筛选出高血脂史X_5为危险因素;向后-条件、向后-LR法另筛选出高血压家族史X_3和年龄X_1为危险因素,向后-Wald法筛另筛选出高血压史X_2为危险因素。结论多因素Logistic回归分析应采用逐步回归方法,对全部变量进行分析,包括单因素分析无统计意义的自变量;把多分类变量当作连续性变量进行分析,会损失部分信息,甚至可能漏掉重要的危险因素;当几种逐步回归变量筛选方法得到的危险因素不同时,最好结合临床和流行病学的意义以及生物学机制等专业知识,选择较为合理的结果。
【作者单位】: 第三军医大学新桥医院循证医学与临床流行病学中心;
【关键词】: Logistic回归 自变量筛选 逐步回归
【分类号】:R541.4;R181.3
【正文快照】: 危险因素研究,常常需要使用多因素Logistic回归分析方法,从调查的自变量中筛选危险因素[1-8]。但在进行多因素Logistic回归分析时,常由于变量及方法选择等原因,得出的回归分析结果有时不一致。笔者结合实例,就多因素Logistic回归分析中自变量筛选及逐步回归方法选择应注意的问
【相似文献】
中国期刊全文数据库 前3条
1 张政;冯国双;;变量投影重要性分析在自变量筛选中的应用[J];现代预防医学;2012年22期
2 苏景铭, 赵守军;“最小”C_p法一一多元回归中变量筛选的一种算法[J];山西医学院学报;1994年02期
3 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 闫孟雨;韩汐;李奇峰;陈达;;新型非线性变量筛选方法在光谱分析中的应用[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
中国硕士学位论文全文数据库 前3条
1 谢文华;Spearman相关系数的变量筛选方法[D];北京工业大学;2015年
2 林燕;偏最小二乘变量筛选法及其应用研究[D];厦门大学;2007年
3 杨国栋;基于变量筛选的偏最小二乘回归方法及其应用[D];中南大学;2013年
本文关键词:Logistic回归变量筛选及回归方法选择实例分析,由笔耕文化传播整理发布。
本文编号:490054
本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/490054.html
最近更新
教材专著