当前位置:主页 > 社科论文 > 社会学论文 >

基于LASSO-CD方法的生存分析研究

发布时间:2017-07-03 03:09

  本文关键词:基于LASSO-CD方法的生存分析研究


  更多相关文章: 生存分析 变量选择 Cox比例风险模型 LASSO方法 坐标下降算法


【摘要】:生存分析作为一种以缺失数据为研究对象的统计方法,近年来其应用范围由最开始的生物医学领域,扩展到了工业、商业、社会科学等很多领域,在这些领域中都存在对某给定事件发生的时间进行估计和预测的问题。 本文在对现有生存分析模型研究的基础上,提出了高维删失数据环境下生存分析模型的研究方法,主要工作及创新点如下: 1、拓展了传统Cox比例风险模型的应用范围。传统的Cox比例风险模型应用范围通常被局限在一定的低维数据空间,当其应用于高维数据空间时会影响其适用性和准确性。针对这一问题,本文利用最小绝对值压缩与选择方法(The Least Absolute Shrinkage and Select Operator, LASSO)的变量选择能力和坐标下降算法(Coordinate Descent, CD)的非线性运算能力提出了一种高维删失数据环境下的Cox比例风险模型变量选择方法; 2、对LASSO方法、CD算法和Cox比例风险模型均进行了较为深入的研究。在此基础上,对传统的Cox比例风险模型进行优化处理使之适用于LASSO方法。对优化后的模型采用CD算法进行变量选择,最后通过使用AIC和BIC截断准则选择出了最优的模型变量子集; 3、采用Matlab实验平台结合蒙特卡洛模拟方法产生适用于生存分析的逐阶Ⅱ类随机高维删失数据,研究了不同样本数目、不同删失比例情况下Cox比例风险模型变量选择方法运行情况,证明了本文理论研究的有效性。之后使用该方法对实际的PBC数据集进行处理,表明了其具有比较好的应用前景。
【关键词】:生存分析 变量选择 Cox比例风险模型 LASSO方法 坐标下降算法
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:C815
【目录】:
  • 摘要3-4
  • Abstract4-7
  • 第一章 绪论7-11
  • 1.1 研究背景及意义7
  • 1.2 研究方法及研究现状7-8
  • 1.3 论文的主要工作8-9
  • 1.4 论文的组织结构9-11
  • 第二章 相关理论研究11-21
  • 2.1 生存分析与变量选择概述11-13
  • 2.1.1 生存分析含义11
  • 2.1.2 生存分析研究内容11
  • 2.1.3 删失数据11-13
  • 2.2 变量选择概述13-14
  • 2.3 COX比例风险模型14-15
  • 2.4 最小绝对值压缩与选择方法15-19
  • 2.5 坐标下降算法19-21
  • 第三章 基于LASSO-CD方法的COX比例风险模型21-27
  • 3.1 Ⅱ类随机删失数据的产生21
  • 3.2 偏似然函数建立21-22
  • 3.3 目标函数的确立22
  • 3.4 模型寻优22-24
  • 3.4.1 AIC截断准则22-23
  • 3.4.2 BIC截断准则23
  • 3.4.3 模型的选择23-24
  • 3.5 本章相关程序MATLAB仿真代码24-27
  • 3.5.1 Ⅱ类随机删失数据的产生代码24-25
  • 3.5.2 CD方法的计算过程代码25-27
  • 第四章 方法有效性分析与实际应用27-33
  • 4.1 方法有效性分析27-31
  • 4.1.1 实验环境27
  • 4.1.2 参数估计27-28
  • 4.1.3 LASSO变量选择28-31
  • 4.2 实际应用31-33
  • 4.2.1 数据来源31
  • 4.2.2 数据预处理31-32
  • 4.2.3 实验结果与分析32-33
  • 第五章 总结与展望33-35
  • 5.1 论文工作总结33
  • 5.2 研究工作展望33-35
  • 参考文献35-37
  • 在学期间的研究成果37-38
  • 致谢38

【参考文献】

中国期刊全文数据库 前5条

1 李新海;王娜;宋海燕;;关于生存分析中的统计方法及其应用[J];东北师大学报(自然科学版);2011年01期

2 田欣媛;周镭;;基于生存分析法的顾客生命周期计量研究——以商业银行信用卡顾客为例[J];管理学报;2011年03期

3 王树云;宋云胜;;线性模型下基于AIC准则的Bayes变量选择[J];山东大学学报(理学版);2010年06期

4 张欣峰;娄清涛;陆建邦;全培良;孙喜斌;;现时生存分析方法的应用实践与评价[J];中国卫生统计;2011年01期

5 闫丽娜;覃婷;王彤;;LASSO方法在Cox回归模型中的应用[J];中国卫生统计;2012年01期

中国博士学位论文全文数据库 前2条

1 项燕彪;高维数据的统计推断[D];浙江大学;2011年

2 王占锋;删失回归模型中若干统计问题的研究[D];中国科学技术大学;2008年


  本文关键词:基于LASSO-CD方法的生存分析研究


  更多相关文章: 生存分析 变量选择 Cox比例风险模型 LASSO方法 坐标下降算法




本文编号:512162

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/512162.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户29fec***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com