基于拓展的隐马尔可夫模型的大规模相依多重检验
发布时间:2022-10-15 21:06
大规模多重检验的问题产生于许多科学研究领域。例如,在全基因组关联分析(GWAS)中,通常需要进行数以万计的检验以寻找与复杂疾病或性状相关联的单核苷酸多态性(SNPs)。一些其它的例子包括:神经影像数据分析[72]、微阵列数据分析[51,52]、空间数据分析[82]等等。到目前为止,一些多重检验方法已经被广泛地应用于众多科学领域。然而,在大规模多重检验中仍然存在一些棘手的问题需要解决。首先,日益产生的“高通量”数据的分析通常需要我们同时进行数以万计的检验。基于传统的控制准则(例如FWER)的多重检验方法过于保守。其次,多重检验中的检验之间通常存在着复杂的相依性。例如,在GWAS中,由于相邻的基因位点在减数分裂过程中倾向于分离到同一个配子中,因此相邻的检验之间存在着复杂的相依结构。最后,多重检验方法忽略协变量效应的影响往往会导致检验功效的损失。例如,在大规模两样本推断中,合适地利用稀疏性信息可以显著地提高检验功效。为了解决上述问题,我们提出了一类基于拓展的隐马尔可夫模型的大规模多重检验方法。理论结果表明:这些新的多重检验方法可以将伪发现率(FDR)控制在预设的显著性水平α,并且在所有的FD...
【文章页数】:110 页
【学位级别】:博士
【文章目录】:
摘要
英文摘要
第一章 序言
1.1 背景介绍
1.1.1 FWER控制准则
1.1.2 FDR控制准则
1.1.3 FNR和ETP
1.2 基于FWER的多重检验方法
1.2.1 Bonferroni方法
1.2.2 Sidak方法
1.2.3 Holm方法
1.3 基于FDR的多重检验方法
1.3.1 BH方法
1.3.2 Lfdr方法
1.3.3 LIS方法
1.4 本文内容和结构安排
第二章 基于因子隐马尔可夫模型的大规模多重检验
2.1 引言
2.2 统计模型和方法
2.2.1 基于因子隐马尔可夫模型的协变量调整的多重检验
2.2.2 协变量调整的多重检验问题和加权分类问题之间的关系
2.2.3 基于因子隐马尔可夫模型的CALIS方法
2.2.4 计算CALIS值的向前-向后算法
2.2.5 估计因子隐马尔可夫模型参数的EM算法
2.3 理论证明
2.3.1 定理2.2.3的证明
2.3.2 定理2.2.4的证明
2.3.3 定理2.2.5的证明
2.4 模拟研究
2.4.1 因子隐马尔可夫模型的相依结构
2.4.2 更真实的SNP相依结构
2.5 实际数据分析
第三章 基于笛卡尔隐马尔可夫模型的可重复性分析
3.1 引言
3.2 统计模型和方法
3.2.1 可重复性分析的框架
3.2.2 笛卡尔隐马尔可夫模型
3.2.3 可重复性分析的repLIS方法
3.2.4 计算repLIS值的向前-向后算法
3.2.5 计算笛卡尔隐马尔可夫模型参数的EM算法
3.3 模拟研究
3.3.1 基于确定模型的模拟
3.3.2 基于基因型数据的模拟
3.4 实际数据分析
3.4.1 寻找基因多效性中的应用
3.4.2 寻找可重复性关联中的应用
第四章 基于半连接的隐马尔可夫模型的两样本推断
4.1 引言
4.2 统计模型和方法
4.2.1 半连接的隐马尔可夫模型
4.2.2 神谕的COALIS方法
4.2.3 数据驱动的COALIS方法
4.3 理论证明
4.3.1 定理4.2.1的证明
4.3.2 定理4.2.2的证明
4.3.3 定理4.2.3的证明
4.4 模拟研究
4.4.1 模拟研究一
4.4.2 模拟研究二
4.5 实际数据分析
第五章 总结与展望
参考文献
附录
致谢
在学期间公开发表论文情况
本文编号:3692040
【文章页数】:110 页
【学位级别】:博士
【文章目录】:
摘要
英文摘要
第一章 序言
1.1 背景介绍
1.1.1 FWER控制准则
1.1.2 FDR控制准则
1.1.3 FNR和ETP
1.2 基于FWER的多重检验方法
1.2.1 Bonferroni方法
1.2.2 Sidak方法
1.2.3 Holm方法
1.3 基于FDR的多重检验方法
1.3.1 BH方法
1.3.2 Lfdr方法
1.3.3 LIS方法
1.4 本文内容和结构安排
第二章 基于因子隐马尔可夫模型的大规模多重检验
2.1 引言
2.2 统计模型和方法
2.2.1 基于因子隐马尔可夫模型的协变量调整的多重检验
2.2.2 协变量调整的多重检验问题和加权分类问题之间的关系
2.2.3 基于因子隐马尔可夫模型的CALIS方法
2.2.4 计算CALIS值的向前-向后算法
2.2.5 估计因子隐马尔可夫模型参数的EM算法
2.3 理论证明
2.3.1 定理2.2.3的证明
2.3.2 定理2.2.4的证明
2.3.3 定理2.2.5的证明
2.4 模拟研究
2.4.1 因子隐马尔可夫模型的相依结构
2.4.2 更真实的SNP相依结构
2.5 实际数据分析
第三章 基于笛卡尔隐马尔可夫模型的可重复性分析
3.1 引言
3.2 统计模型和方法
3.2.1 可重复性分析的框架
3.2.2 笛卡尔隐马尔可夫模型
3.2.3 可重复性分析的repLIS方法
3.2.4 计算repLIS值的向前-向后算法
3.2.5 计算笛卡尔隐马尔可夫模型参数的EM算法
3.3 模拟研究
3.3.1 基于确定模型的模拟
3.3.2 基于基因型数据的模拟
3.4 实际数据分析
3.4.1 寻找基因多效性中的应用
3.4.2 寻找可重复性关联中的应用
第四章 基于半连接的隐马尔可夫模型的两样本推断
4.1 引言
4.2 统计模型和方法
4.2.1 半连接的隐马尔可夫模型
4.2.2 神谕的COALIS方法
4.2.3 数据驱动的COALIS方法
4.3 理论证明
4.3.1 定理4.2.1的证明
4.3.2 定理4.2.2的证明
4.3.3 定理4.2.3的证明
4.4 模拟研究
4.4.1 模拟研究一
4.4.2 模拟研究二
4.5 实际数据分析
第五章 总结与展望
参考文献
附录
致谢
在学期间公开发表论文情况
本文编号:3692040
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3692040.html