基于梯度提升树的生存分析优化方法研究及应用
发布时间:2024-03-27 23:20
生存分析(time-to-event analysis)在医疗健康和金融等领域有着广泛的应用。特别是在临床疾病预后研究中,生存分析发挥着重要作用。它旨在研究个体在不同观测期发生感兴趣事件的概率,寻找观测变量与感兴趣事件之间潜在的因果关系,探究事件发生的重要影响因子及模式。而生存分析方法,主要通过建立模型从数据中学习观测变量和发生事件时间分布之间的关系来达到这一目的。然而,现有的生存分析方法存在多个问题。首先,在模型假设方面,一些统计线性模型和集成树模型将个体发生事件时间的分布函数假定为某种带参数的特定表达式。但是,当数据分布未知或缺乏先验知识时,这些模型假设会极大地限制其预测性能。其次,在模型解释性方面,一些深度学习模型虽然拥有强大的表达能力,但却无法对观察变量的影响模式做出解释。这在一定程度上限制了它们的实用性。此外,当数据分布已知或具备先验知识时,基于比例风险假设的Cox流派算法会采用偏似然估计函数作为目标函数。然而,当数据中有大量事件发生时,由于目标函数的近似不够精确,模型参数估计会受到影响,从而导致模型预测性能下降。而且,Cox流派算法中存在一些由于缺少正则化参数而容易出现过拟...
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
本文编号:3940649
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
图2-2生存分析相关函数转化图
电子科技大学硕士学位论文图2-2生存分析相关函数转化图2.2生存分析统计模型分析生存数据通常需要借助生存分析方法。传统的生存分析方法大多从统计学的角度来分析生存数据。这类方法可以分为非参数方法,半参数方法和参数方法。非参数方法主要包括Kaplan-Meier估计方法[27]和Ne....
图2-3梯度提升树模型
第二章相关工作损失函数l,即Ft=argminFtn∑i=1l(yi,yt1i+Ft(xi)).(2-9)Ridgeway等人研究的Cox比例风险模型与梯度提升树模型结合的生存分析方法可参见[18,19]。其核心思想是在梯度提升树的框架下,以优化偏似然估计函数(公式(2-6)所示....
图2-4DeepHit模型结构图
电子科技大学硕士学位论文损失函数极小的节点分裂,以及计算每个叶子节点估计量。相比原来的梯度提升树方法,XGBoost采用更加精确的损失函数二阶近似方法,进而推导出完全不同的优化策略,同时XGBoost中的正则化项可以有效避免过拟合。类似地,在生存分析中,对输入梯度提升树模型的某个....
图3-1HitBoost模型框架
电子科技大学硕士学位论文的累积概率,其表达式为F(i,t)=P(τ≤t,δ=1|xi)=∑τ≤tyiτ.(3-2)图3-1HitBoost模型框架当给定生存数据和特定的目标函数(见下节)后,多颗梯度提升树模型在每一轮迭代的过程中,通过梯度提升算法并行地学习协变量和风险函数之间的潜....
本文编号:3940649
本文链接:https://www.wllwen.com/kejilunwen/yysx/3940649.html