基于纵向数据对成人高血压患病率影响因素的研究

发布时间：2020-08-02 11:11

【摘要】：伴随国家实力的增强和全球范围内科学技术的发展,民众的生活水平普遍得到提高,同时医疗水平和公共卫生的进步也延长了人的寿命。多种类疾病的困扰随着个体的生存时间接踵而来。我国居民的高血压患病率总体呈上升趋势,且高血压引起的诸多心脑血管疾病对人的身体和经济造成巨大威胁,对于高血压疾病的预防和治疗刻不容缓。个体患有高血压的影响因素是复杂和因人而异的。本文旨在探究在社会属性、身体状况、饮食营养和生活习惯等方面中可能影响个体患有高血压的因素以及影响程度,通过广义混合效应模型给出具有说服力的分析。本文将使用中国健康与营养调查收集的中国从2004年至2011年间的四次调查数据进行实例分析。我们首先对高血压的危害和严峻形势进行了分析,通过阅读大量文献对研究中的候选解释变量进行了筛选。然后,我们对全数据进行处理后获得成人高血压数据并完成了深入剖析和描述工作。其次,文章通过拟合logistic混合效应模型对纵向数据进行分析。我们以AIC和BIC准则作为变量选择方法对不同的变量组合构成的模型进行比较,进而完成变量选择工作并获得最终模型。结果表明对患有高血压存在显著影响的变量有个体年龄,性别,劳动强度,能量与碳水化合物的摄入量,腰围和身体质量指数。最后,我们对模型的拟合结果进行了较为合理的解释,并为个体健康和预防高血压疾病提出了建议。
【学位授予单位】：哈尔滨工业大学
【学位级别】：硕士
【学位授予年份】：2018
【分类号】：R544.1
【图文】：

不同年龄,变量

图 3-1 不同年龄的人数分布3.2 数据的描述我们在第 3 章中对原始数据中可能涉及的变量进行了描述，然后根据全连接的理论和方法对不同数据表进行了连接。针对部分在调查问卷中未直接获得但是我们预计使用的变量，通过公认的标准进行了构造。由于全体样本本身含有大量的缺失值，因此我们需要对数据中的缺失情况进行逐步的处理。最后，根据数据描述的环节所得到各个变量的统计结果，我们针对个别变量的取值情况进行了处理，排除了一些取值严重超出正常值的样本。经过上述步骤的处理，我们得到了最终用来拟合模型的的数据。其中，初始数据共计 129 094 条，经过处理最后剩余 18 269 条。变量共计 25 个，他们分别是个体编号、调查年份、省份、户口类别、性别、年龄、个人收入、日均工作时间、受教育程度、主要职业、劳动强度、三日平均能量摄入、三日平均碳水化合物摄入、三日平均脂肪摄入、三日平均蛋白质摄入、睡眠、吸烟、饮酒、疾病史、腰围、高血压、

分布图,样本数量,年龄,受教育程度

图3-2年龄在[18,93]区间的样本数量分布

受教育程度,应用统计,样本数量,论文

最高受教育程度的人数分布

【参考文献】