SCAD和ADS方法在比例风险模型中的应用
发布时间:2017-10-14 22:48
本文关键词:SCAD和ADS方法在比例风险模型中的应用
更多相关文章: 高维数据 比例风险模型 SCAD方法 ADS方法 oracle性质
【摘要】:随着数据获取技术的高速发展,人们在生物信息学、医药卫生等领域获得的信息越来越多,数据维数越来越高,传统的模型选择方法的应用受到了制约.高维数据分析与建模是目前统计领域研究的热点之一,应用广泛,如何降维是进行高维数据分析的一大挑战.传统COX比例风险回归模型是生存资料分析最常用的方法,但对高维数据已不再适用.变量选择方法是对这些高维数据进行降维处理的有效办法,比较典型的变量选择方法有SCAD和ADS.因此本文将普通线性模型下的SCAD和ADS方法应用到COX比例风险回归模型中,提出了该模型下的SCAD和ADS变量选择方法,并研究其相关性质,主要内容如下:(1)本文给出了COX比例风险模型下SCAD方法的定义,构造了β的SCAD惩罚函数的估计量,探讨SCAD方法用于高维生存数据分析的大样本结果,证明了SCAD惩罚估计量具有oracle性质;提出了一种SCAD变量选择方法,对LASSO变量选择方法进行了改进,该方法保留初始模型中较大的参数,将贡献较小的变量系数压缩为0,有效降低了模型的偏差;利用数值模拟验证SCAD方法能处理共线性问题,选出真实的模型,并将该方法与LASSO方法比较,结果表明SCAD方法优于LASSO方法,实例验证了SCAD方法的合理性.(2)本文给出COX比例风险模型下ADS方法的定义,证明了ADS估计量具有oracle性质,理论上说明了该方法可以实现COX比例风险模型的变量选择,并给出相应的参数估计.基于数据中常见的变量维数大于样本量的情况,提出了ADS变量选择方法,通过数值模拟,结果显示ADS拟合效果良好,优于LASSO和DS方法.
【关键词】:高维数据 比例风险模型 SCAD方法 ADS方法 oracle性质
【学位授予单位】:广西大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:O212.1
【目录】:
- 摘要4-6
- ABSTRACT6-10
- 第一章 绪论10-17
- 1.1 研究背景10-11
- 1.2 变量选择方法的相关研究11-14
- 1.2.1 LASSO方法的发展12-13
- 1.2.2 SCAD方法的研究13-14
- 1.2.3 DS和ADS方法的发展14
- 1.3 比例风险模型的研究14-15
- 1.4 文章的内容及结构安排15-17
- 第二章 相关理论基础17-24
- 2.1 COX比例风险模型17-19
- 2.2 LASSO变量选择方法19-20
- 2.3 SCAD变量选择方法介绍20-22
- 2.3.1 SCAD方法20-21
- 2.3.2 正则参数的选取21-22
- 2.4 ADS变量选择方法介绍22-23
- 2.5 本章小结23-24
- 第三章 SCAD变量选择方法在COX模型中的应用24-33
- 3.1 引言24
- 3.2 COX比例风险模型的SCAD方法24-25
- 3.3 SCAD方法的oracle性质25-30
- 3.4 数值模拟30-31
- 3.5 实例分析31-32
- 3.6 本章小结32-33
- 第四章 ADS变量选择方法在COX模型中的性质33-39
- 4.1 引言33
- 4.2 COX模型中ADS方法的定义33-34
- 4.3 ADS估计量的性质34-36
- 4.4 数值模拟36-38
- 4.5 本章小结38-39
- 结论与展望39-41
- 参考文献41-45
- 致谢45-46
- 攻读学位期间论文发表情况46
【参考文献】
中国期刊全文数据库 前1条
1 曹芳;朱永忠;;基于多重共线性的Lasso方法[J];江南大学学报(自然科学版);2012年01期
中国硕士学位论文全文数据库 前3条
1 周荣旺;SCAD方法的调整参数选择[D];大连理工大学;2010年
2 闫丽娜;惩罚COX模型和弹性网技术在高维数据生存分析中的应用[D];山西医科大学;2011年
3 吴晓萍;基于LASSO-CD方法的生存分析研究[D];兰州大学;2014年
,本文编号:1033630
本文链接:https://www.wllwen.com/kejilunwen/yysx/1033630.html