基于广义主成分分析的全基因组生物检测模型研究
发布时间:2022-12-17 20:38
广义主成分分析(Generalized principal component analysis,GPCA)是以主成分分析(Principal component analysis,PCA)为基础发展起来的,其思想与主成分分析相同,是用较少的指标代替多的指标来反映原来指标的信息.例如,有n个样品,每个样品测得p个指标,共有np个数据.由于指标之间往往互有影响,从p个指标中找出几个综合指标并对其进行分析,这样就可以使用小于p个指标去计算,却能得到p个指标计算出来的结果.从海量的单核苷酸多态性(Single nucleotide polymorphisms,SNPs)中,挑选出与疾病或某些临床、环境因素有关的位点,仍是全基因组关联分析中(Genomewide association study,GWAS)的一个重要的课题.本文针对表型-SNP构成的二维列联表结构,提出了一个GPCA模型,该模型是同时对所有SNPs建立的.具体就是对该模型的矩阵作奇异值分解(Singular value decomposition,SVD),来达到减少模型中参数的个数,因此该模型也可称Logistic SVD...
【文章页数】:51 页
【学位级别】:硕士
【文章目录】:
中文摘要
abstract
第1章 绪论
1.1 研究背景
1.1.1 GWAS
1.1.2 GPCA
1.2 已有SNPs检测方法介绍
1.2.1 皮尔逊的χ2检验
1.2.2 Logistic回归
1.2.3 回归分析
1.2.4 Lasso回归
1.2.5 LogisticANOVA
1.3 本文研究主要内容和创新点
第2章 GPCA模型及参数估计
2.1 GPCA模型
2.2 参数估计―MM算法
2.3 惩罚项参数的选择
2.4 本章小结
第3章 模拟研究
3.1 模拟设计
3.2 SNP筛选准则评估
3.2.1 使用LogisticANOVA模型对SNP筛选准则评估
3.2.2 使用LogisticSVD模型对SNP筛选准则评估
3.3 LogisticSVD模型稳健性探测
3.4 本章小结
第4章 基于NMRI小鼠数据的实例分析
4.1 数据预处理
4.2 结果分析
结论
参考文献
致谢
攻读学位期间发表的学术论文
【参考文献】:
期刊论文
[1]基于广义主成分分析法的我国高速公路服务设施平均间距研究[J]. 潘兵宏,苗慕楠,张锟. 公路交通科技. 2017(04)
[2]Logistic回归模型的统计诊断[J]. 曾婕,胡国治. 数理统计与管理. 2017(04)
[3]基于Lasso和支持向量机的粮食价格预测[J]. 喻胜华,龚尚花. 湖南大学学报(社会科学版). 2016(01)
[4]基于高通量测序的全基因组关联研究策略[J]. 周家蓬,裴智勇,陈禹保,陈润生. 遗传. 2014(11)
[5]Properties and Iterative Methods for the Lasso and Its Variants[J]. Hong-Kun XU. Chinese Annals of Mathematics(Series B). 2014(03)
[6]Logistic回归模型的影响分析[J]. 谭宏卫,曾捷. 数理统计与管理. 2013(03)
[7]精神分裂症的全基因组关联分析研究[J]. 崔东红,江开达. 上海精神医学. 2011(05)
[8]全基因组关联研究现状[J]. 韩建文,张学军. 遗传. 2011(01)
[9]全基因组关联分析的进展与反思[J]. 凃欣,石立松,汪樊,王擎. 生理科学进展. 2010(02)
[10]基于广义主成分分析的步态识别算法研究[J]. 王科俊,贲晛烨,孟玮,魏娟. 哈尔滨工程大学学报. 2009(09)
本文编号:3720610
【文章页数】:51 页
【学位级别】:硕士
【文章目录】:
中文摘要
abstract
第1章 绪论
1.1 研究背景
1.1.1 GWAS
1.1.2 GPCA
1.2 已有SNPs检测方法介绍
1.2.1 皮尔逊的χ2检验
1.2.2 Logistic回归
1.2.3 回归分析
1.2.4 Lasso回归
1.2.5 LogisticANOVA
1.3 本文研究主要内容和创新点
第2章 GPCA模型及参数估计
2.1 GPCA模型
2.2 参数估计―MM算法
2.3 惩罚项参数的选择
2.4 本章小结
第3章 模拟研究
3.1 模拟设计
3.2 SNP筛选准则评估
3.2.1 使用LogisticANOVA模型对SNP筛选准则评估
3.2.2 使用LogisticSVD模型对SNP筛选准则评估
3.3 LogisticSVD模型稳健性探测
3.4 本章小结
第4章 基于NMRI小鼠数据的实例分析
4.1 数据预处理
4.2 结果分析
结论
参考文献
致谢
攻读学位期间发表的学术论文
【参考文献】:
期刊论文
[1]基于广义主成分分析法的我国高速公路服务设施平均间距研究[J]. 潘兵宏,苗慕楠,张锟. 公路交通科技. 2017(04)
[2]Logistic回归模型的统计诊断[J]. 曾婕,胡国治. 数理统计与管理. 2017(04)
[3]基于Lasso和支持向量机的粮食价格预测[J]. 喻胜华,龚尚花. 湖南大学学报(社会科学版). 2016(01)
[4]基于高通量测序的全基因组关联研究策略[J]. 周家蓬,裴智勇,陈禹保,陈润生. 遗传. 2014(11)
[5]Properties and Iterative Methods for the Lasso and Its Variants[J]. Hong-Kun XU. Chinese Annals of Mathematics(Series B). 2014(03)
[6]Logistic回归模型的影响分析[J]. 谭宏卫,曾捷. 数理统计与管理. 2013(03)
[7]精神分裂症的全基因组关联分析研究[J]. 崔东红,江开达. 上海精神医学. 2011(05)
[8]全基因组关联研究现状[J]. 韩建文,张学军. 遗传. 2011(01)
[9]全基因组关联分析的进展与反思[J]. 凃欣,石立松,汪樊,王擎. 生理科学进展. 2010(02)
[10]基于广义主成分分析的步态识别算法研究[J]. 王科俊,贲晛烨,孟玮,魏娟. 哈尔滨工程大学学报. 2009(09)
本文编号:3720610
本文链接:https://www.wllwen.com/linchuangyixuelunwen/3720610.html
最近更新
教材专著