惩罚广义线性模型在遗传关联研究中的应用及R软件实现
发布时间:2017-05-26 17:02
本文关键词:惩罚广义线性模型在遗传关联研究中的应用及R软件实现,,由笔耕文化传播整理发布。
【摘要】:目的遗传关联研究中高维数据与日俱增。本文探讨基于岭估计、LASSO和弹性网的广义线性模型在遗传关联研究的应用及软件实现,为高维关联分析提供方法学参考。方法介绍惩罚广义线性模型原理及软件实现方法,并采用模拟的连锁平衡和连锁不平衡的SNPs关联研究数据,以惩罚logistic模型例证R软件glmnet包对广义线性模型的拟合。结果对连锁平衡和连锁不平衡SNPs模拟数据,LASSO与弹性网均给出稀疏解,较好地选择有关联SNPs而剔除无关联变量;而岭估计把所有变量都保留在模型中,模型复杂度高但相应的解释度未增加。结论 LASSO和弹性网可对高维遗传关联数据进行有效降维,筛选变量的同时提供参数估计,从而降低模型的复杂度。R软件的glmnet包灵活拟合各类惩罚广义线性模型,可在高通量遗传关联分析中推广应用。
【作者单位】: 广东药学院公共卫生学院流行病与卫生统计学系;
【关键词】: 惩罚广义线性模型 遗传关联研究 LASSO 弹性网 glmnet包
【基金】:国家自然科学基金(81302493) 广东省科技厅社会发展基金(2014A020212307) 广东省自然科学基金(S2013040013590)
【分类号】:R394
【正文快照】: 近年来随着高通量测序技术在遗传流行病学研究中的应用,大量的高维遗传关联数据不断涌现,如动辄成百上千甚至数以万计的SNPs(single nucleotide pol-ymorphisms)数据呈现高维度的特征,给遗传关联统计分析带来极大挑战[1]。在许多情况下,研究中响应变量的分布非正态,且与高维自
【相似文献】
中国期刊全文数据库 前1条
1 熊林平,曹秀堂,徐勇勇,陆健;纵向观测二分类数据的广义线性模型分析[J];第二军医大学学报;1999年07期
中国硕士学位论文全文数据库 前2条
1 郝永红;广义线性模型的稳健估计及其医学应用[D];山西医科大学;2009年
2 宋捷;联系函数未知时对ROC的估计[D];四川大学;2005年
本文关键词:惩罚广义线性模型在遗传关联研究中的应用及R软件实现,由笔耕文化传播整理发布。
本文编号:397463
本文链接:https://www.wllwen.com/xiyixuelunwen/397463.html
最近更新
教材专著