随机生存森林在高维基因组数据生存分析中的应用
本文选题:随机生存森林 + 偏Cox回归 ; 参考:《中国卫生统计》2013年06期
【摘要】:目的探讨随机生存森林(RSF)在高维基因组数据生存分析中的应用和适用性。方法通过模拟实验和实际数据分析,对随机生存森林、生存支持向量机(SSVM)和偏Cox回归(PCR)三种方法进行比较,并用生存预测的一致性错误率对其进行评价。结果模拟实验表明,在有交互作用的情况下,RSF的log-rank和logrankscore方法的预测效果均优于SSVM和PCR方法;实际数据分析结果显示,随机生存森林与生存支持向量机和偏Cox回归的预测效果相近,应用RSF方法筛选变量后建立的RSF模型能够在一定程度上提高预测效果。结论随机生存森林方法适用于高维生存数据的研究,对疾病的生存时间预测和预后因素分析具有实用价值。
[Abstract]:Objective to investigate the application and applicability of RSFs in survival analysis of high dimensional genomic data. Methods through simulation experiments and actual data analysis, the three methods of random survival forest, survival support vector machine (SSVM) and partial Cox regression (PCR) were compared, and the consistency error rate of survival prediction was evaluated. Results the simulation results show that the prediction effect of log-rank and logrankscore methods is better than that of SSVM and logrankscore methods in the case of interaction, and the actual data analysis results show that, The prediction effect of random survival forest is similar to that of survival support vector machine and partial Cox regression. The RSF model established by RSF method can improve the prediction effect to some extent. Conclusion the random survival forest method is suitable for the study of high dimensional survival data and has practical value in predicting the survival time of disease and analyzing the prognostic factors.
【作者单位】: 哈尔滨医科大学卫生统计学教研室;
【基金】:国家自然科学基金资助(81172767) 高等学校博士学科专项基金(20122307110004) 伍连德青年科学基金(WLD-QN1105)
【分类号】:R341
【参考文献】
相关期刊论文 前1条
1 武晓岩;李康;;随机森林方法在基因表达数据分析中的应用及研究进展[J];中国卫生统计;2009年04期
【共引文献】
相关期刊论文 前3条
1 李放歌;王志鹏;户国;李辉;;全基因组关联研究中的交互作用研究现状[J];遗传;2011年09期
2 陈金瓯;柳青;;DNA微阵列数据判别的旋转森林方法[J];中国卫生统计;2012年04期
3 孙凤宇;李贞子;侯艳;李康;;基于小波变换的代谢组色谱指纹图谱的判别分析[J];中国卫生统计;2013年02期
相关会议论文 前1条
1 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
相关博士学位论文 前2条
1 任晓卫;上海地区人群甲型流感HA抗原进化与基因进化关系研究及H1N1流感潜在免疫显性位点的筛选[D];复旦大学;2010年
2 邱智军;蛋白质结合位点预测方法研究与应用[D];大连理工大学;2012年
相关硕士学位论文 前2条
1 惠娜;近红外光谱分析技术在党参及复方丹参片质量控制中的应用[D];兰州大学;2011年
2 朱晶晶;高维病例—对照研究中交互作用的随机森林分析方法探讨[D];南京医科大学;2012年
【相似文献】
相关期刊论文 前10条
1 李民;杨连娟;涂宏刚;李佳琳;鞠强;李莉;章强强;;小鼠播散性马尔尼菲青霉菌感染模型的建立及其生存率分析[J];中国皮肤性病学杂志;2010年06期
2 何培芳,何川,吴天清,刘鸿莲,胡新珉,李正国,何伦德,辛浩洋,袁支润,张子彬,罗德诚;人体心脏舒张最大吸力的模拟实验研究[J];中国医学物理学杂志;2004年01期
3 熊林平,曹秀堂,孟岳良,郭祖超;临床随访资料的Markov模型构建与应用研究[J];第二军医大学学报;1999年06期
4 梁正东,王开发,杨旭;Breslow算法非容许误差校正[J];第三军医大学学报;2003年18期
5 范志民,邹本荣,刘国津,邱吉庆,张吉斌;鼠移植胶质瘤手术加光敏治疗的实验研究[J];中国激光医学杂志;1996年03期
6 贺宪民,贺佳,范思昌;径向基网络及用于生存预测的探讨[J];医学信息;2001年08期
7 苏景铭, 赵守军;“最小”C_p法一一多元回归中变量筛选的一种算法[J];山西医科大学学报;1994年02期
8 赵耐青;生存分析的最小样本含量计算[J];上海医科大学学报;1994年05期
9 蔡泳;病例随访资料的统计分析方法——生存分析[J];上海口腔医学;2004年04期
10 赵耐青,高峻;多结局Cox模型在医学中的应用和Stata实现[J];中国医院统计;2004年04期
相关会议论文 前1条
1 刘纳新;管敏强;陈通克;施红旗;姚建高;张启瑜;;两种大鼠急性坏死性胰腺炎模型的比较和改良[A];2007年浙江省外科学学术会议论文汇编[C];2007年
相关硕士学位论文 前6条
1 韩栋;生存分析中非劣效临床试验样本量估计方法研究[D];南方医科大学;2013年
2 任晓卫;半参数加速失效时间模型及其在医学中的应用[D];山西医科大学;2007年
3 赵景义;长期生存者资料的参数混合模型[D];山西医科大学;2008年
4 李艳芳;饮食限制对雌性老龄大鼠抗衰老效应的实验研究[D];山西医科大学;2010年
5 王印;人类细胞周期及凋亡网络的模型建立与模拟分析研究[D];哈尔滨工业大学;2010年
6 庞裕;多位点基因关联分析[D];华东师范大学;2012年
,本文编号:2030953
本文链接:https://www.wllwen.com/yixuelunwen/jichuyixue/2030953.html