纵向监测非随机缺失资料变系数模型及其应用
发布时间:2017-11-03 12:19
本文关键词:纵向监测非随机缺失资料变系数模型及其应用
更多相关文章: 变系数模型 纵向监测 非随机缺失 贝叶斯惩罚样条函数 敏感性分析
【摘要】:在医学纵向研究中,数据缺失往往无法避免。如果反应变量的缺失与未观测到的反应变量有关,则缺失机制为非随机缺失。对于含有非随机缺失机制的纵向数据,目前常用模式混合模型进行分析。然而,非随机缺失模式混合模型仅考虑了某几个固定时间点上的数据缺失,将缺失时间的分布看作离散分布。但在实际问题研究中,研究对象常由于有事或外出等原因,未能按规定的时间点实施监测。此时,数据缺失的发生,就不仅局限于预先设计的几个固定时间点上,而可能发生在观测期内的任一时间点,即缺失时间为连续分布。此时,模式混合模型就无能为力了。 本研究针对存在非随机缺失,且缺失时间为连续分布的纵向监测资料,在模式混合模型的基础上,通过贝叶斯惩罚样条函数,探索构建纵向数据均值参数与方差成分均随缺失时间变化的变系数模型(varyingcoefficientmodelsVCMs)。由于缺失时间的分布类型未知,建模时假定模型回归系数和方差成分均通过未知的平滑函数随缺失时间变化。 本研究通过模拟研究,证实了不同缺失比例和样本含量下变系数模型参数估计结果的准确性,并将该模型应用于全国社区高血压规范化管理纵向监测研究的数据分析中。主要结果如下: 1、在不同的样本含量和缺失比例下,变系数模型均能得到较准确的参数估计值。 模拟研究结果证实,在缺失比例一定的情况下,随着样本含量的增加,变系数模型的参数估计值越来越接近于真值;当样本含量达到300时,参数估计值趋向于稳定;且随着样本含量的逐渐增大,参数估计的标准误越来越小。在样本含量一定的情况下,缺失比例对参数估计值的影响不大,即不同的缺失比例下均能得到与模拟真值相近的参数估计值;但随着缺失比例的增加,参数估计的标准误也随之增大。 2、非随机缺失的变系数模型可更客观的解释社区高血压规范化管理资料,结果解释合理。 社区高血压规范化管理资料中研究结果表明,收缩压和舒张压的截距项、年龄参数、性别参数等均随缺失时间而变化,即早期缺失的高血压患者和晚期缺失的高血压患者具有不同的模型参数。患者收缩压变系数模型研究表明,高血压患者的年龄参数随缺失时间呈下降趋势,且为负值,说明晚期缺失的高血压患者的血压值随年龄的下降趋势更明显。性别参数呈上升趋势,且为正值,说明晚期缺失的高血压患者,男性收缩压的控制效果优于女性。对舒张压而言,高血压病程呈上升趋势,且为正值,高血压病程对早期缺失的患者影响较小,而对于晚期高血压患者来说,,高血压病程越长,舒张压越高。 3、敏感性分析进一步证实变系数模型对社区高血压规范化管理资料的参数估计效果较好,结果可靠。 本研究在建立变系数模型时,假定对于包含缺失信息的观测值与未包含缺失信息的观测值具有相同的参数估计结果。但是该假定无法用已观测到的数据进行验证,故有必要进行敏感性分析。四个社区不同性别血压估计值变化的敏感性分析结果表明,在设定敏感性参数a=5和a=10时,不同敏感性参数下的估计结果与原模型估计值相近,说明该数据用变系数模型估计效果较好,结果解释合理。 综上所述,本文从原理、方法介绍、计算机编程与实现及高血压规范化管理实例分析,系统阐述了一种处理伴有非随机缺失纵向数据的变系数模型。该模型是在模式混合模型原理的基础上,利用贝叶斯惩罚样条函数构建的。模型中容许把模型回归系数和方差成分均视为缺失时间u的未知平滑函数。它克服了模式混合模型中缺失时间为离散分布的不足,解决了缺失是连续型分布的问题,是缺失时间为连续分布的非随机缺失机制纵向数据分析的最佳选择。
【关键词】:变系数模型 纵向监测 非随机缺失 贝叶斯惩罚样条函数 敏感性分析
【学位授予单位】:山西医科大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:R181.3
【目录】:
- 摘要5-7
- Abstract7-10
- 第一章 前言10-13
- 第二章 原理与方法13-17
- 2.1 变系数模型的基本原理13
- 2.2 非随机缺失机制13-14
- 2.3 含有非随机缺失的变系数模型14-15
- 2.4 连续纵向非随机缺失数据的变系数模型15
- 2.5 参数估计15-16
- 2.6 敏感性分析16
- 2.7 软件实现16-17
- 第三章 模拟研究17-22
- 第四章 实例分析22-35
- 4.1 太原市社区高血压规范化管理基线资料描述22-24
- 4.2 变系数模型对社区高血压规范化管理资料的分析24-31
- 4.3 变系数模型对社区高血压规范化管理资料分析结果的敏感性分析31-35
- 第五章 讨论35-38
- 第六章 小结38-39
- 参考文献39-42
- 个人简介42
- 发表学术论文42-43
- 致谢43
【参考文献】
中国期刊全文数据库 前8条
1 王学丽;;不完全数据下响应变量的精度估计[J];滨州学院学报;2007年06期
2 王学丽,耿直;借助优势比信息识别不可忽略缺失数据的模型参数[J];数理统计与管理;2005年03期
3 李志强;薛留根;;缺失数据下广义变系数模型的均值借补估计[J];数理统计与管理;2007年03期
4 李志强;薛留根;;响应变量随机缺失下的广义变系数模型的估计[J];系统科学与数学;2008年10期
5 于伟程;;具有随机缺失协变量的广义变系数模型[J];统计与决策;2008年09期
6 罗羡华;杨振海;周勇;;删失数据下的变系数回归模型[J];应用数学学报;2006年03期
7 罗羡华;李元;周勇;杨振海;;基于纵向数据的半参数变系数部分线性回归模型[J];应用数学学报;2007年03期
8 庄严;邢艳春;马文卿;;含有缺失机制的多元纵向数据分析[J];中国卫生统计;2008年05期
中国硕士学位论文全文数据库 前2条
1 王吉祥;删失数据下的变系数模型的回归分析[D];湖南师范大学;2008年
2 谢易林;随机缺失下自适应变系数模型的相关估计与性质[D];湖南师范大学;2010年
本文编号:1136168
本文链接:https://www.wllwen.com/yixuelunwen/liuxingb/1136168.html