当前位置:主页 > 医学论文 > 医卫管理论文 >

基于多重填补法合并广义估计方程的疾病危险因素评估研究

发布时间:2020-10-15 01:50
   目的通过多重填补法合并广义估计方程解决老年人健康管理档案中疾病危险因素评估时面临的数据缺失和重复测量问题,并利用模拟研究验证填补后数据集得到的参数估计结果的准确性,从而为健康管理档案的利用提供分析方法,更为相应疾病的预防和控制提供科学的参考依据。方法本研究通过苏州市相城区第三人民医院采集老年人2011-2015年(2013年除外)健康管理档案中的相关信息。选取高血糖(数值变量)和胆囊结石(分类变量)两种常见疾病作为研究实例。利用多重填补法处理数据缺失问题,利用广义估计方程处理重复测量问题,并对评估结果进行综合推断。最后,通过模拟实验比较1000个缺失数据集填补前后拟合得到的参数估计值与完整数据集参数估计值的接近程度以及Ⅰ类错误和Ⅱ类错误的发生概率。结果1.研究资料特征分布情况本研究共采集8325位不同老年人健康管理档案信息,累计23195条观测记录。研究对象中,各年最小年龄均为57岁,最大年龄为2014年的96岁。各年度女性人数均多于男性人数。四次采集中,仅被检测1次的为1668人,被重复测量2次的为1452人,被重复测量3次的为2197人,被重复测量4次的为3008人。2.多重填补情况在纳入的指标中只有性别、年龄为完整变量,其余变量缺失率范围为0.06%-18.44%,样本实际有效率为76.99%。不管在评估高血糖还是胆囊结石危险因素时,数据资料都呈任意缺失模式。多重填补后,均产生10个完整的不同数据集,所有变量填补效率都在0.97以上。3.疾病危险因素评估情况高血糖多因素综合推断显示:高血压、超重、肥胖、心率过快、高胆固醇血症、混合型高脂血症、低密度脂蛋白胆固醇、高尿酸血症、丙氨酸氨基转移酶偏高和天冬氨酸氨基转移酶偏高的OR值(95%CI)分别为1.27(1.20-1.36)、1.25(1.16-1.34)、1.65(1.48-1.85)、1.68(1.58-1.79)、1.18(1.06-1.31)、1.17(1.02-1.33)、1.11(1.04-1.17)、1.17(1.09-1.27)、1.18(1.03-1.35)、1.19(1.03-1.39)。胆囊结石多因素综合推断显示:超重、肥胖、甘油三酯血症、低高密度脂蛋白血症、高血肌酐、天冬氨酸氨基转移酶偏高、高血糖、年龄增加和女性的OR值(95%CI)分别为1.14(1.08-1.21)、1.27(1.16-1.38)、1.12(1.06-1.19)、1.17(1.05-1.31)、1.20(1.03-1.39)、1.12(1.02-1.22)、1.09(1.04-1.15)、1.37(1.29-1.45)、1.85(1.65-2.06)。4.缺失填补前后模型的比较情况在比较高血糖患病风险模型时,混合型高脂血症和天冬氨酸氨基转移酶偏高的统计学意义发生改变。在比较胆囊结石患病风险模型时,低密度脂蛋白胆固醇和高血肌酐的统计学意义发生改变。两模型的?和r值都表明缺失对体质指数的参数估计影响最大。5.模拟实验结果在1000次重复中,填补模型和未填补模型中的贫血、甘油三酯血症、混合型高脂血症、低高密度脂蛋白血症、天冬氨酸氨基转移酶偏高的Ⅰ类错误发生次数分别为0次VS 1次、0次VS 5次、300次VS 388次、0次VS 5次、56次VS 244次。Ⅱ类错误发生概率在填补后的模型中亦得到明显减少,高胆固醇血症的Ⅱ类错误发生次数从163次降低到11次。填补后模型中性别、年龄、高血压、心率过快、贫血、甘油三酯血症、高胆固醇血症、混合型高脂血症、低密度脂蛋白胆固醇、高血肌酐、高尿酸血症和丙氨酸氨基转移酶偏高的回归系数更加接近完整数据集的回归系数。结论通过多重填补法合并广义估计方程能够有效解决健康管理档案中疾病危险因素评估时遇到的数据缺失和重复测量问题。这为老年人健康管理档案数据的利用提供相应的分析方法,也为遇到相同问题的其它数据资料的统计分析提供一定的思路。公共卫生部门在老年人健康管理时应加强对可能引起高血糖和胆囊结石患病的相关因素的监测,加强健康指导,改变老年人的不良生活方式以控制相应疾病的发生。
【学位单位】:苏州大学
【学位级别】:硕士
【学位年份】:2017
【中图分类】:R197.1
【部分图文】:

年龄分布,性别构成,年份,人群


6340、6325、6296、4234。1.1.年龄分布被采集信息的老年人中,最小年龄均为 57 岁,最大年龄为 2014 年的 96 岁。均年龄较大为 70.4±6.7 岁,2011 年较小为 66.3±7.6 岁,具体情况详细表 3表 3-1 不同年份样本人群年龄分布状况 人数 最小值 最大值 均数 标准1 6340 57 95 66.3 7.2 6325 57 93 66.4 7.4 6296 57 96 68.0 6.5 4234 57 93 70.4 6.1.2 性别分布在性别分布上,各年份女性人数均多于男性人数,人数相差最多的年份为 2015 年, 人。人数相差最少的年份为 2014 年,相差 176 人。各年份性别构成情况详见图 3-1。
【参考文献】

相关期刊论文 前10条

1 周婷;刘祥;李晓松;刘元元;;中国人群2型糖尿病影响因素的Meta分析[J];中华流行病学杂志;2016年05期

2 鲍晓蕾;高辉;胡良平;;多种填补方法在纵向缺失数据中的比较研究[J];中国卫生统计;2016年01期

3 谢平;黄坚;;2型糖尿病危险因素的研究进展[J];应用预防医学;2016年01期

4 申宁宁;房瑞玲;高宇钊;李少琼;张军锋;刘桂芬;;纵向研究缺失数据多重填补及混合效应模型分析[J];中国药物与临床;2015年07期

5 曲萍;;落实国家基本公共卫生服务规范 提高社区居民健康水平[J];黑龙江医学;2015年06期

6 邹莉玲;吴娟丽;李觉;;多重填补法在任意缺失随访资料中的应用[J];中国卫生统计;2015年02期

7 李雪原;张雪雷;仇丽霞;;广义估计方程处理重复测量数据的参数解释[J];中国药物与临床;2015年02期

8 张松群;;社区居民慢性病现状及其影响因素调查[J];中医药管理杂志;2015年01期

9 洪梅;;我国老年人健康管理工作现况分析及启示[J];中国农村卫生事业管理;2014年12期

10 马庆华;辛柏青;马亚娜;周晓华;徐文新;孙宏鹏;唐育红;马兰;薛斌;;老年人静息心率过快与糖尿病发病关系的队列研究[J];中国初级卫生保健;2014年10期


相关硕士学位论文 前4条

1 辛柏青;老年人糖尿病发病风险模型的建立[D];苏州大学;2015年

2 杨林;几种填补方法的比较及在纵向数据缺失中的应用[D];山西医科大学;2014年

3 石丽;多重插补在成分数据缺失值补全中的应用[D];山西大学;2012年

4 茅群霞;缺失值处理统计方法的模拟比较研究及应用[D];四川大学;2005年



本文编号:2841510

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2841510.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户554e0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com