两类带有测量误差和潜在因子的Cox模型
发布时间:2020-12-31 11:31
在医学研究中,Cox模型是处理生存数据的经典模型,它构建了生存时间和协变量之间的关系,将生存分析从经验性研究推广到实证预后研究.由于Cox模型的灵活性,它还被广泛应用于生物学、经济学、管理学等其他领域.但是在实际研究中,常常不能够完全得到所有变量的观测值.一部分原因在于部分变量难以准确观测,观测值存在随机误差.另一部分原因在于,协变量中存在一些不可观测的潜在变量.另外,随着信息的完善,临床研究越来越关注多个事件间的相关性.然而,经典的Cox模型只能估计单一事件的风险函数,无法处理多个事件的风险相关性.为了解决上述问题,本文对经典的Cox模型进行了拓展研究.首先,对于单一终点事件,本文将测量误差、潜在因子和经典的Cox模型相结合,采用轮廓似然估计和EM算法结合的估计方法进行参数估计,在降低估计参数维数的同时,确保了估计的稳定性.通过数值模拟,从估计偏差和均方误差两方面验证了估计方法的优越性,并且将该方法运用到艾滋病的实际案例数据中.另外,本文还将上述模型进一步推广到多个事件的半竞争风险数据中,建立半竞争风险Cox模型.结合极大似然估计和EM算法提出模型的估计方法.同样利用数值模拟结果说明...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1:在(A)竞争风险和(B)半竞争风险框架下,病人进行状态转移的图示.??实际上,终点事件不一定是死亡,只需要满足终点事件和非终点事件的定义??即可.例如,艾滋病人感染HIV病毒和确诊发病可以是一对非终点事件和终点事件,??
逐渐产生耐药性,另一种可能是受过长期治疗的受试者本身体内HIV病毒的潜伏??期时间也已经比较长了.??最后,给出了基准生存函数SJt)?=?exp(-ylQ(t))的估计,如图3所示.红色实??线为基于CSFC得到的生存曲线,黑色虚线和蓝色点虚线分别是SFC和CC估计的??生存函数.从图上可以看出,SFC模型估计的基准风险最小,基准生存概率最大,生??存函数曲线最靠上.其次是本文提出的CSFC模型.CC模型得到的基准风险最大,??基准生存概率最小.???表7?:三个模型的参数估计表???估计参数?CSFC?SFC?CC??^?-0.505?-0.455?-0.513??p2?-0.689?-0.671?-0.685??-0.168?-0.168?-0.185??^?0.195?0.190?0.182??q1?0.863?0.698?—??q2?1.031?0.895?
浙江大学硕士学位论文?第4章带有测量误差和共享脆弱因子的半竞争风险Cox模型??相对来说,无论是n?=?500或1000,?CEM估计的风险函数曲线与真实曲线都是??最为接近的,并且样本量越大,估计得越准确.而Bayes-MCMC和ML-NR得到的曲线??估计都不太理想.另外,当〇〇增大时,SEM算法的估计效果明显下降,尤其是\2的??估计曲线基本变成了一条横线.??n=500?n=1000??
【参考文献】:
期刊论文
[1]轮廓似然函数在水文气象极值推断不确定性分析中的应用[J]. 鲁帆,王浩,严登华,张冬冬,肖伟华. 中国科学:技术科学. 2013(12)
[2]基于轮廓似然函数的PM10极值浓度分析[J]. 李柚,王斌,杨育杰. 中国环境监测. 2010(06)
硕士论文
[1]流行病学中脆弱模型及其参数估计[D]. 董育凤.扬州大学 2014
本文编号:2949527
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1:在(A)竞争风险和(B)半竞争风险框架下,病人进行状态转移的图示.??实际上,终点事件不一定是死亡,只需要满足终点事件和非终点事件的定义??即可.例如,艾滋病人感染HIV病毒和确诊发病可以是一对非终点事件和终点事件,??
逐渐产生耐药性,另一种可能是受过长期治疗的受试者本身体内HIV病毒的潜伏??期时间也已经比较长了.??最后,给出了基准生存函数SJt)?=?exp(-ylQ(t))的估计,如图3所示.红色实??线为基于CSFC得到的生存曲线,黑色虚线和蓝色点虚线分别是SFC和CC估计的??生存函数.从图上可以看出,SFC模型估计的基准风险最小,基准生存概率最大,生??存函数曲线最靠上.其次是本文提出的CSFC模型.CC模型得到的基准风险最大,??基准生存概率最小.???表7?:三个模型的参数估计表???估计参数?CSFC?SFC?CC??^?-0.505?-0.455?-0.513??p2?-0.689?-0.671?-0.685??-0.168?-0.168?-0.185??^?0.195?0.190?0.182??q1?0.863?0.698?—??q2?1.031?0.895?
浙江大学硕士学位论文?第4章带有测量误差和共享脆弱因子的半竞争风险Cox模型??相对来说,无论是n?=?500或1000,?CEM估计的风险函数曲线与真实曲线都是??最为接近的,并且样本量越大,估计得越准确.而Bayes-MCMC和ML-NR得到的曲线??估计都不太理想.另外,当〇〇增大时,SEM算法的估计效果明显下降,尤其是\2的??估计曲线基本变成了一条横线.??n=500?n=1000??
【参考文献】:
期刊论文
[1]轮廓似然函数在水文气象极值推断不确定性分析中的应用[J]. 鲁帆,王浩,严登华,张冬冬,肖伟华. 中国科学:技术科学. 2013(12)
[2]基于轮廓似然函数的PM10极值浓度分析[J]. 李柚,王斌,杨育杰. 中国环境监测. 2010(06)
硕士论文
[1]流行病学中脆弱模型及其参数估计[D]. 董育凤.扬州大学 2014
本文编号:2949527
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2949527.html