结合生物信息先验的贝叶斯压缩模型在遗传关联研究中的应用
发布时间:2022-07-02 11:03
背景随着高通量测序技术的快速发展,产生了大量外显子测序(whole exome sequencing,WES)和全基因组测序(whole genome sequencing,WGS)数据,为研究者们探索与复杂疾病/性状关联的常见变异(common variance,CV)或稀有变异(rare variance,RV)提供了更多机会。但面对快速涌现的遗传数据,虽然已有很多遗传关联研究的方法被提出,但由于检验功效的缺乏,从海量变异中发现与复杂疾病关联的致病变异依然是有限的,统计方法依然面临巨大挑战。近年来有研究者提出,提高遗传变异检验效能的一种方法是将SNPs(Single Nucleotide Polymorphisms)的生物学信息以先验形式结合到统计模型中并用于遗传关联研究中。而且,随着生物信息学技术的发展,大量公共生物信息功能数据库的出现,为遗传变异提供了多种生物信息先验。因此,本研究鉴于目前遗传关联研究效能低的问题,将生物信息先验评分结合到贝叶斯压缩模型来识别SNPs,并应用于遗传关联研究中,与常规统计方法比较,为提高复杂疾病关联SNPs的发现率提供方法学支持。方法本研究采用结合...
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
缩略词中英文对照表
摘要
abstract
第一章 前言
第二章 模型原理与方法
2.1 广义线性模型
2.2 贝叶斯压缩模型
2.2.1 模型原理
2.2.2 模型拟合和算法
2.3 生物信息数据库
2.3.1 PolyPhen-2 数据库
2.3.2 SIFT数据库
2.3.3 RegulomeDB数据库
2.3.4 CADD数据库
第三章 实例研究
3.1 GAW19 数据简介
3.2 GAW19 数据预处理
3.2.1 连续型表型数据集
3.2.2 二分类表型数据集
3.3 生物信息先验的评分检索
3.4 生物信息先验的评分转换
3.5 研究策略
3.5.1 统计分析策略
3.5.2 方法评价指标和分析结果判定
3.5.3 压缩参数设置和最优压缩范围的确定
3.6 统计软件
第四章 结果
4.1 连续型结局变量
4.1.1 无压缩参数
4.1.2 固定压缩参数
4.1.3 变异特异性压缩参数
4.2 二分类结局变量
4.2.1 无压缩参数
4.2.2 固定压缩参数
4.2.3 变异特异性压缩参数
第五章 讨论
第六章 结论
参考文献
综述 遗传关联研究中生物信息先验的应用现状
参考文献
附录
致谢
攻读硕士学位期间发表的文章
本文编号:3654250
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
缩略词中英文对照表
摘要
abstract
第一章 前言
第二章 模型原理与方法
2.1 广义线性模型
2.2 贝叶斯压缩模型
2.2.1 模型原理
2.2.2 模型拟合和算法
2.3 生物信息数据库
2.3.1 PolyPhen-2 数据库
2.3.2 SIFT数据库
2.3.3 RegulomeDB数据库
2.3.4 CADD数据库
第三章 实例研究
3.1 GAW19 数据简介
3.2 GAW19 数据预处理
3.2.1 连续型表型数据集
3.2.2 二分类表型数据集
3.3 生物信息先验的评分检索
3.4 生物信息先验的评分转换
3.5 研究策略
3.5.1 统计分析策略
3.5.2 方法评价指标和分析结果判定
3.5.3 压缩参数设置和最优压缩范围的确定
3.6 统计软件
第四章 结果
4.1 连续型结局变量
4.1.1 无压缩参数
4.1.2 固定压缩参数
4.1.3 变异特异性压缩参数
4.2 二分类结局变量
4.2.1 无压缩参数
4.2.2 固定压缩参数
4.2.3 变异特异性压缩参数
第五章 讨论
第六章 结论
参考文献
综述 遗传关联研究中生物信息先验的应用现状
参考文献
附录
致谢
攻读硕士学位期间发表的文章
本文编号:3654250
本文链接:https://www.wllwen.com/yixuelunwen/jichuyixue/3654250.html
教材专著