绵羊高密度SNP芯片GGP OvineHD的设计
发布时间:2021-01-04 07:28
绵羊是主要的家畜之一,为人类提供重要的食物及纺织品原料。SNP芯片是人们进行现代遗传育种便捷高效的工具。随着基因组测序及生物信息学分析手段的丰富与成熟,人们对绵羊的基因组、特定变异与相关性状的关系有了更为深入的了解。现有绵羊高密度芯片为新西兰农业研究所(AgResearch)设计的包含606K位点的OvineHD BeadChip,其主要依据国外品种绵羊数据进行筛选,缺乏中国绵羊品种特有的SNP标记,而且对功能性位点和区域的体现不足,位点均匀度不够。为满足当前育种生产上对芯片位点功能检测、功能研究方面的需求,体现中国地方品种绵羊的遗传特点,本文研究依托世界范围内共817只绵羊的重测序数据,以绵羊v4.0基因组和最新三代绵羊基因组为参考,结合已有的与绵羊功能相关的研究,设计了一款636K高密度绵羊SNP芯片——Affymetrix GeneSeek Genomic Profiler OvineHD(GGP OvineHD)。主要研究结果如下:(1)该芯片最终包含位点636336个,距离小于1000bp和大于8000bp的位点数相较OvineHD BeadChip减少59.76%。(2)在...
【文章来源】:西北农林科技大学陕西省 211工程院校 985工程院校 教育部直属院校
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
绵羊数据来源及群体结构分析(Zhaoetal.2017)
图 1-2 依靠 SNP 数据进行的 GWAS 分析(Demars et al. 2013)Figure 1-2 GWAS analysis based on SNP data (Demars et al. 2013)吉阳等人在 2016(Yang et al. 2016)年的研究中,重测序了 77 个绵羊样本的数据,用来分析绵羊对极端环境的适应模式及基因组层面的规律。为验证重测序获得的 SNP结果的可靠性,他们将重测序结果与绵羊dbSNP及33只绵羊个体OvineSNP50 Beadchip数据进行比较,最终得到两个 SNP 集合的结果的平均一致率为 95.51%,从而证明了他们重测序 SNP 结果的可靠性。在生产方面,Brito 等人在 2017 年(Brito et al. 2017)的研究中通过绵羊高密度芯片获得的 SNP 数据进行育种值的分析,并得到有关生长、产奶、产肉等重要生产相关性状的育种值的预测方法。其在同年的另一项研究中(Brito et al. 2017),通过绵羊高密度芯片获得的数据分析了新西兰绵羊群体结构,得出不同品种的有效种群规模随品种的不同而变化很大的结论。
图 2-1 数据个体所属区域展示Figure 2-1 Display of individual area通过这批数据,我们获得的 SNP 数量是 40187239 个,通过 Affymetrix 公司的位点质量评估系统评估后,公司从中评估出 26093865 个推荐位点,本次芯片设计所筛选的位点,除部分重要的功能位点外,基本全部来自这个 26M 位点集合。2.1.2 分析软件及工具VCFtools 是一个程序包,用于处理 VCF 文件。VCFtools 的目的是提供易于访问的方法,以 VCF 文件的形式处理复杂的遗传变异数据。此工具集可用于对 VCF 文件执行操作包括过滤掉特定的变体、比较文件、总结变体、转换为不同的文件类型、验证和合并文件及创建变体的交叉点和子集等。其可以通 http://vcftools.sourceforge.net/downloads.html 网址下载。本文研究所使用给 VCFtools 版本为 0.1.14。Perl 是一种丰富的计算机程序语言,为本文研究文本处理方面的问题提供大量解决工具,本文研究所使用的 Perl 版本为 5.10.1。其可以通过 http://www.perl.org/get.html网址下载。
【参考文献】:
期刊论文
[1]基因芯片与高通量测序技术的原理与应用的比较[J]. 徐晓丽,林娟,鄢仁祥. 中国生物化学与分子生物学报. 2018(11)
本文编号:2956400
【文章来源】:西北农林科技大学陕西省 211工程院校 985工程院校 教育部直属院校
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
绵羊数据来源及群体结构分析(Zhaoetal.2017)
图 1-2 依靠 SNP 数据进行的 GWAS 分析(Demars et al. 2013)Figure 1-2 GWAS analysis based on SNP data (Demars et al. 2013)吉阳等人在 2016(Yang et al. 2016)年的研究中,重测序了 77 个绵羊样本的数据,用来分析绵羊对极端环境的适应模式及基因组层面的规律。为验证重测序获得的 SNP结果的可靠性,他们将重测序结果与绵羊dbSNP及33只绵羊个体OvineSNP50 Beadchip数据进行比较,最终得到两个 SNP 集合的结果的平均一致率为 95.51%,从而证明了他们重测序 SNP 结果的可靠性。在生产方面,Brito 等人在 2017 年(Brito et al. 2017)的研究中通过绵羊高密度芯片获得的 SNP 数据进行育种值的分析,并得到有关生长、产奶、产肉等重要生产相关性状的育种值的预测方法。其在同年的另一项研究中(Brito et al. 2017),通过绵羊高密度芯片获得的数据分析了新西兰绵羊群体结构,得出不同品种的有效种群规模随品种的不同而变化很大的结论。
图 2-1 数据个体所属区域展示Figure 2-1 Display of individual area通过这批数据,我们获得的 SNP 数量是 40187239 个,通过 Affymetrix 公司的位点质量评估系统评估后,公司从中评估出 26093865 个推荐位点,本次芯片设计所筛选的位点,除部分重要的功能位点外,基本全部来自这个 26M 位点集合。2.1.2 分析软件及工具VCFtools 是一个程序包,用于处理 VCF 文件。VCFtools 的目的是提供易于访问的方法,以 VCF 文件的形式处理复杂的遗传变异数据。此工具集可用于对 VCF 文件执行操作包括过滤掉特定的变体、比较文件、总结变体、转换为不同的文件类型、验证和合并文件及创建变体的交叉点和子集等。其可以通 http://vcftools.sourceforge.net/downloads.html 网址下载。本文研究所使用给 VCFtools 版本为 0.1.14。Perl 是一种丰富的计算机程序语言,为本文研究文本处理方面的问题提供大量解决工具,本文研究所使用的 Perl 版本为 5.10.1。其可以通过 http://www.perl.org/get.html网址下载。
【参考文献】:
期刊论文
[1]基因芯片与高通量测序技术的原理与应用的比较[J]. 徐晓丽,林娟,鄢仁祥. 中国生物化学与分子生物学报. 2018(11)
本文编号:2956400
本文链接:https://www.wllwen.com/yixuelunwen/dongwuyixue/2956400.html
最近更新
教材专著