当前位置:主页 > 硕博论文 > 社科博士论文 >

超高维生存数据的变量筛选和异常值点识别的研究

发布时间:2021-11-23 06:32
  本文讨论了两个问题:超高维生存数据的变量筛选和指数回归模型中生存数据的异常值点识别.在超高维数据中,确定独立筛选法能以很高概率在保留所有重要变量的前提下快速有效地降低数据的维数.现有的变量筛选方法大多数是针对完全数据提出的,无法处理存在删失的生存数据.本文提出了三种不依赖于模型的变量筛选法来处理超高维生存数据,它们分别是基于删失累积残差、相关性秩排序和Kolmogorov-Smirnov检验统计量.这三种方法在比较弱的正则化条件下拥有确定筛选性(sure screening property)和秩相合性(ranking consistency).模拟实验结果说明这三种方法的表现优于已有的方法.最后我们把它们应用到套细胞淋巴瘤的实例分析中.现实生活中的大部分数据集会存在异常值点,异常值点的存在会对参数估计、统计推断和模型选择带来不利影响.目前对完全观测数据中异常值点的研究已经硕果累累,却很少有人研究带删失的生存数据中的异常值点识别.本文提出惩罚似然的方法来检测指数回归模型中的异常值点,它可以处理带有删失的生存数据.我们把异常值点识别问题转换成高维正则化回归中的参数估计问题,并采用坐标下降... 

【文章来源】:武汉大学湖北省 211工程院校 985工程院校 教育部直属院校

【文章页数】:138 页

【学位级别】:博士

【部分图文】:

超高维生存数据的变量筛选和异常值点识别的研究


图2.1:?2.4.1节的Cox比例风险模型中,重要变量石和非重要变量a

曲线,异常值点,生成机制,方法


图5.1:在四种不同的异常值点生成机制下,naive方法和本章提出的方法所得到的??Kaplan-Meier估计的曲线.??

曲线,化学治疗,激素治疗,乳腺癌


图5.2:德国乳腺癌研宄中接受激素治疗和化学治疗病人的Kaplan-Meier生存曲??线.??


本文编号:3513321

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/sklbs/3513321.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bafca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com