当前位置:主页 > 医学论文 > 医卫管理论文 >

基于比例风险模型的生存分析研究

发布时间:2020-06-10 13:11
【摘要】:Cox比例风险模型能够分析生存时间对协变量的依赖关系,由于该模型可以分析包含删失样本的生存资料,在一定程度上缓解了样本不足的问题,且不要求估计资料的生存分布类型,因此是生存分析领域应用最广泛的模型之一。选择与存活表型相关的预后基因是生存分析研究的重要课题。为了解决基因表达谱的高维度和共线性问题,常用的方法是使用?_1范数估计,因此Cox模型的改进算法Lasso-Cox模型是有效的解决方案。基于稀疏回归算法,Lasso-Cox模型的正则化参数必须通过交叉验证仔细调整以优化性能,这通常会消耗大量的计算资源。本文提出一种数据驱动的稀疏回归算法(Bayesian-Lasso),采用贝叶斯方法从数据中自动学习正则化参数,并利用交替迭代的方法求解回归系数。模拟实验结果表明,与传统的Lasso方法相比,Bayesian-Lasso方法在预测性能方面具有很强的竞争力,模型更稳定,计算时间更短。真实基因数据实验表明,该算法选择的预后基因与表型密切相关,可以用于高维基因表达谱预后预测模型的建立。由于不同疾病之间可能存在内在联系,因此相关的生存预测模型很普遍,这涉及多任务生存分析问题。另外,在实践中获得足够的标记训练实例用于学习稳健的预测模型可能是非常困难的。针对上述问题,本文提出了一种基于Cox模型的多任务学习方法(MT-Cox),其使用?_(2,1)范数来鼓励多个预测变量共享相似的稀疏模式,考虑不同任务之间的相关性并增加用于训练每个任务的信息,从而提高预测性能。为了提高模型稳定性并加速计算,同样采用贝叶斯方法和交替迭代方法求解参数。实验部分在癌症基因组图谱(TCGA)数据集上证明本文所提出的多任务学习方法的性能,结果表明与其他相关的竞争方法相比,该方法可以显著提高模型的预测性能。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:O212.3;R195.1

【参考文献】

相关期刊论文 前1条

1 杨凤翔,王顺庆,徐海根,李邦庆;生存分析理论及其在研究生命表中的应用[J];生态学报;1991年02期



本文编号:2706335

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2706335.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ef3d2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com