基于相关个体拷贝数变异数据的趋势检验及在孤独症数据中的应用
发布时间:2021-12-09 22:31
拷贝数变异是人类基因组遗传多样性的重要组成部分,是当前的研究热点.然而相应的关联研究方法不多,尤其是个体有血缘关系时.本文基于相关个体,在Cochran-Armitage趋势检验的基础上,针对拷贝数变异数据是可基因分型和不可基因分型两种情形,推导出检验方法 MTT.随机模拟结果表明:MTT方法具有良好的功效表现,适用范围更广.同时,本文比较了不同数据采集方案对MTT功效的影响,结果表明相关病例不相关对照具有较高的性价比.运用MTT分析孤独症真实数据,检测出与疾病显著相关的拷贝数变异位点和相关基因,基因功能富集分析和文献检索说明了结果的可靠性,这为后续研究提供了指引.
【文章来源】:复旦学报(自然科学版). 2020,59(06)北大核心CSCD
【文章页数】:12 页
【部分图文】:
家系数据和(b)相关病例不相关对照数据中,零假设下MTT的P值与均匀分布的Q-Q图
随机模拟3:传统家系数据的研究方法聚焦于一对父母和患病小孩,例如传递不平衡检验(Transmission Disequilibrium Test,TDT)[21],FBAT(Family-Based Association Test)[22]等.这些家系中若存在健康小孩(Sibling)的信息,则通常会忽略.而使用MTT可以利用家系中健康小孩的信息来提升检验功效.为此,我们比较如下3种数据收集方案对功效的影响,方案Ⅰ:每个家庭包含一对健康父母加一个患病小孩;方案Ⅱ:每个家庭在方案Ⅰ基础上加一个健康小孩;方案Ⅲ:每个家庭在方案Ⅰ基础上加一个健康人群对照.家庭数量定为500个(方案Ⅰ包含1 500个个体,方案Ⅱ包含2 000个个体,方案Ⅲ包含2 000个个体).图3 相关病例不相关对照数据中,CATT和MTT方法在3种疾病模型下的功效
图2 家系数据中,CATT、GE和MTT方法在3种疾病模型下的功效从模拟结果图4中可以看出,方案Ⅲ表现最佳,而方案Ⅱ与方案Ⅰ相比,在功效表现上并没有多少提升,这个结果有些出乎预料.其原因可能是未患病小孩的遗传信息和两位健康父母接近(这也是有研究方法用未患病小孩信息来估计缺失的父母信息的原因之一),因而并不能为统计量提供更多的额外信息.
【参考文献】:
期刊论文
[1]新一代测序的拷贝数变异检测算法研究与设计[J]. 李燕,李垚垚. 生物信息学. 2015(03)
[2]基因组拷贝数变异及其突变机理与人类疾病[J]. 杜仁骞,金力,张锋. 遗传. 2011(08)
本文编号:3531425
【文章来源】:复旦学报(自然科学版). 2020,59(06)北大核心CSCD
【文章页数】:12 页
【部分图文】:
家系数据和(b)相关病例不相关对照数据中,零假设下MTT的P值与均匀分布的Q-Q图
随机模拟3:传统家系数据的研究方法聚焦于一对父母和患病小孩,例如传递不平衡检验(Transmission Disequilibrium Test,TDT)[21],FBAT(Family-Based Association Test)[22]等.这些家系中若存在健康小孩(Sibling)的信息,则通常会忽略.而使用MTT可以利用家系中健康小孩的信息来提升检验功效.为此,我们比较如下3种数据收集方案对功效的影响,方案Ⅰ:每个家庭包含一对健康父母加一个患病小孩;方案Ⅱ:每个家庭在方案Ⅰ基础上加一个健康小孩;方案Ⅲ:每个家庭在方案Ⅰ基础上加一个健康人群对照.家庭数量定为500个(方案Ⅰ包含1 500个个体,方案Ⅱ包含2 000个个体,方案Ⅲ包含2 000个个体).图3 相关病例不相关对照数据中,CATT和MTT方法在3种疾病模型下的功效
图2 家系数据中,CATT、GE和MTT方法在3种疾病模型下的功效从模拟结果图4中可以看出,方案Ⅲ表现最佳,而方案Ⅱ与方案Ⅰ相比,在功效表现上并没有多少提升,这个结果有些出乎预料.其原因可能是未患病小孩的遗传信息和两位健康父母接近(这也是有研究方法用未患病小孩信息来估计缺失的父母信息的原因之一),因而并不能为统计量提供更多的额外信息.
【参考文献】:
期刊论文
[1]新一代测序的拷贝数变异检测算法研究与设计[J]. 李燕,李垚垚. 生物信息学. 2015(03)
[2]基因组拷贝数变异及其突变机理与人类疾病[J]. 杜仁骞,金力,张锋. 遗传. 2011(08)
本文编号:3531425
本文链接:https://www.wllwen.com/yixuelunwen/jsb/3531425.html
最近更新
教材专著