中国45岁以上人群抑郁症状相关因素分析
发布时间:2021-08-11 08:04
目的:本研究应用XGBoost提升树模型和随机森林模型对中国健康与养老追踪调查数据库(高维)中与抑郁症状有关的变量进行初步筛选,再使用logistic回归模型对筛选后的数据进行分析,探索抑郁症状相关因素,了解中国45岁以上人群抑郁症状情况并为其预防和治疗提供可靠依据。方法:1.本研究使用2011年中国健康与养老追踪调查数据,调查对象为中国45岁及以上人群。抑郁症状应用抑郁量表简表(CES-D10)进行评估,根据文献将得分在10分及以上的定为有抑郁症状。2.根据最优参数构建XGBoost提升树模型和随机森林模型,按照变量重要性评分选出两个模型排名前100的变量,将两个模型的共同变量作为重要变量。使用选出的重要变量建立logistic模型,计算贝叶斯信息准则(Bayesian Information Criterions,BIC)评分,通过5-折交叉验证计算模型准确率,与使用全部变量建立的模型进行对比,评价变量筛选效果。3.本研究使用python3.7软件中XGBoost和Random Forest Classifier软件包以及R3.6软件中glm软件包进行分析。结果:1.数据库中共17...
【文章来源】:河北医科大学河北省
【文章页数】:49 页
【学位级别】:硕士
【部分图文】:
统计分析流程图(A:数据整理;B:建模分析)
13人,抑郁症状患病率43.35%。农村5422人,抑郁症状患病率40.65%;城市2897人,抑郁症状患病率30.17%。研究对象基线资料见表1-2与图2。表1研究对象基线资料Table1Samplecharacteristics抑郁男性女性症状身高(cm)体重(kg)年龄(岁)身高(cm)体重(kg)年龄(岁)否164.1±10.063.4±11.459.1±8.6153.2±9.357.8±11.157.2±8.5是162.7±8.259.8±11.660.6±8.6152.2±8.755.2±10.658.8±8.6表2研究对象基线资料Table2Samplecharacteristics男性例数(%)女性例数(%)抑郁症状农村城镇合计农村城镇合计否1759(66.91)1015(76.03)2764(69.98)1459(52.24)1008(64.53)2467(56.65)是870(33.09)320(23.97)1190(30.02)1334(47.76)554(35.47)1888(43.35)合计262913353964279315624355图2抑郁症状患病率:按照年龄性别和居住地分组Fig.2Prevalenceofdepressivesymptoms:groupedbyage,sexandplaceofresidence
【参考文献】:
期刊论文
[1]采用XGBoost和随机森林探索中国西部女性乳腺癌危险因素[J]. 彭佳丽,刘春容,李旭,易芳,李佳圆. 现代预防医学. 2020(01)
[2]基于XGBoost对肺鳞癌和肺腺癌的分类预测[J]. 冷菲,李巍. 首都医科大学学报. 2019(06)
[3]恶性甲状腺肿瘤预测模型选择与实证研究[J]. 刘超,戈晓晨,邵洁,崔骁. 统计与管理. 2019(11)
[4]基于机器学习算法的2型糖尿病患者3个月血糖预测[J]. 覃伟,高敏,沈莹,史宇晖,吴涛,赵艾,孙昕霙. 中华疾病控制杂志. 2019(11)
[5]基于多组学数据融合构建乳腺癌生存预测模型[J]. 齐惠颖,江雨荷. 数据分析与知识发现. 2019(08)
[6]基于机器学习的放射组学预测非小细胞肺癌EGFR基因突变[J]. 胡丽霞,江长思,罗燕,梅东东,龚静山,马捷. 医学影像学杂志. 2019(07)
[7]机器学习模型在预测肾结石输尿管软镜碎石术后早期结石清除率中的应用[J]. 朱学华,杨明钰,夏海缀,何为,张智荧,刘余庆,肖春雷,马潞林,卢剑. 北京大学学报(医学版). 2019(04)
[8]基于机器学习方法的原发性肝癌患者预后预测研究[J]. 李琳,杨日东,王哲,张学良,周毅. 中国数字医学. 2019(03)
[9]基于改进集成学习算法的在线空气质量预测[J]. 夏润,张晓龙. 武汉科技大学学报. 2019(01)
[10]基于随机森林变量选择的飞灰含碳量预测模型[J]. 王芳,马素霞,王河. 热力发电. 2018(11)
硕士论文
[1]随机森林和支持向量机在乳腺癌高维转录组数据中的应用[D]. 郭志旺.河北医科大学 2019
本文编号:3335803
【文章来源】:河北医科大学河北省
【文章页数】:49 页
【学位级别】:硕士
【部分图文】:
统计分析流程图(A:数据整理;B:建模分析)
13人,抑郁症状患病率43.35%。农村5422人,抑郁症状患病率40.65%;城市2897人,抑郁症状患病率30.17%。研究对象基线资料见表1-2与图2。表1研究对象基线资料Table1Samplecharacteristics抑郁男性女性症状身高(cm)体重(kg)年龄(岁)身高(cm)体重(kg)年龄(岁)否164.1±10.063.4±11.459.1±8.6153.2±9.357.8±11.157.2±8.5是162.7±8.259.8±11.660.6±8.6152.2±8.755.2±10.658.8±8.6表2研究对象基线资料Table2Samplecharacteristics男性例数(%)女性例数(%)抑郁症状农村城镇合计农村城镇合计否1759(66.91)1015(76.03)2764(69.98)1459(52.24)1008(64.53)2467(56.65)是870(33.09)320(23.97)1190(30.02)1334(47.76)554(35.47)1888(43.35)合计262913353964279315624355图2抑郁症状患病率:按照年龄性别和居住地分组Fig.2Prevalenceofdepressivesymptoms:groupedbyage,sexandplaceofresidence
【参考文献】:
期刊论文
[1]采用XGBoost和随机森林探索中国西部女性乳腺癌危险因素[J]. 彭佳丽,刘春容,李旭,易芳,李佳圆. 现代预防医学. 2020(01)
[2]基于XGBoost对肺鳞癌和肺腺癌的分类预测[J]. 冷菲,李巍. 首都医科大学学报. 2019(06)
[3]恶性甲状腺肿瘤预测模型选择与实证研究[J]. 刘超,戈晓晨,邵洁,崔骁. 统计与管理. 2019(11)
[4]基于机器学习算法的2型糖尿病患者3个月血糖预测[J]. 覃伟,高敏,沈莹,史宇晖,吴涛,赵艾,孙昕霙. 中华疾病控制杂志. 2019(11)
[5]基于多组学数据融合构建乳腺癌生存预测模型[J]. 齐惠颖,江雨荷. 数据分析与知识发现. 2019(08)
[6]基于机器学习的放射组学预测非小细胞肺癌EGFR基因突变[J]. 胡丽霞,江长思,罗燕,梅东东,龚静山,马捷. 医学影像学杂志. 2019(07)
[7]机器学习模型在预测肾结石输尿管软镜碎石术后早期结石清除率中的应用[J]. 朱学华,杨明钰,夏海缀,何为,张智荧,刘余庆,肖春雷,马潞林,卢剑. 北京大学学报(医学版). 2019(04)
[8]基于机器学习方法的原发性肝癌患者预后预测研究[J]. 李琳,杨日东,王哲,张学良,周毅. 中国数字医学. 2019(03)
[9]基于改进集成学习算法的在线空气质量预测[J]. 夏润,张晓龙. 武汉科技大学学报. 2019(01)
[10]基于随机森林变量选择的飞灰含碳量预测模型[J]. 王芳,马素霞,王河. 热力发电. 2018(11)
硕士论文
[1]随机森林和支持向量机在乳腺癌高维转录组数据中的应用[D]. 郭志旺.河北医科大学 2019
本文编号:3335803
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3335803.html