当前位置:主页 > 理工论文 > 生物学论文 >

基于二代测序技术对SNP检测软件的比较研究

发布时间:2021-07-05 18:31
  目的:在高通量技术和SNP分子标记技术日渐普及的今天,越来越多的研究需要从高通量测序技术产生的reads中获得有效的SNP遗传信息,以进行进一步研究。随着分子实验技术的进一步发展,更多的有效、快速并且高通量的SNP检测方法不停的被研究者开发出来。但目前对于各种SNP calling的方法比较还比较少,究竟什么样的测序策略配合什么种类的SNP calling方法能获得最有效的结果依然不明朗。在大多是研究工作者将该步骤交给测序公司处理分析的背景下,这一点尤为突出。方法:本研究通过比较目前较为常用的六种SNP calling软件(Varscan,Altas-snp2,GATK,Freebayes,SOAPsnp2和SAMtools)在两种数据集,模拟数据集和真实数据集中calling SNP的表现,对这一问题进行了一定程度上的解读,为研究者对于目前的SNP calling情况进行了解提供了便利。结果:研究结果显示,这六种SNP calling软件产生的分析结果差异较大:在使用真实数据进行SNP检测的结果中,SOAPsnp能够检测出最多的SNP,Freebays和Atlas-snp2检测出的S... 

【文章来源】:石河子大学新疆维吾尔自治区 211工程院校

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

基于二代测序技术对SNP检测软件的比较研究


VCF格式实例Figure1-1VCFformatexample图注:CHROM:相应的参考序列名称,POS(position):变异所在的位置,ID:variant的

流程图,流程图,格式,多态性


图 1-2 Varscan 流程图[85]Freebayes[84]是一种贝叶斯遗传变异检测器,旨在发现小的多态性,特别是SNP,插入缺失(插入和缺失),MNP(多核苷酸多态性)和复杂事件(复合插入和替换事件)。这个插件允许在单个样本上运行 FreeBayes。该软件最早于 2012年 7 月发表于《Quantitative Biology》。以下为各个 SNP calling 软件的初步对比(表 1-1),由表可知大部分 SNPcalling 软件的核心算法都是贝叶斯算法,但在后续的优化上各有不同。从输入数据格式来看,除了 SOAPsnp 是其专属的 SOAP out 格式外,其他都为 SAM 或者BAM 格式。

箱形,软件,测序,低质量


图 2-1 用于测序质量分数的箱形图(由软件 FastQC 生成)Figure 2-1 Box plot for sequencing quality scores (generated by software FastQC)图中:蓝线代表每个基数的平均质量得分。 红线代表中位数。黄色方框代表第 25 至第 75百分位数。In the figure: the blue line represents the average quality score for each cardinality. The red linerepresents the median. The yellow box represents the 25th to 75th percentile.2.3.2 是否去除低质量碱基,对检测出来的 SNP 数量的影响:对未进行低质量碱基删除的 reads,使用六种不同 SNP calling 软件进行 SNPcalling,在原始数据中,在 6,333,357 个单端读数中,大约 70%通过 SOAP2 和BWA 与人类基因组 hg18 比对上。在六个 SNP 检测软件中,每个软件都能够检测到 110 到 400 个 Non-dbSNP(可能是新的,未被其他研究者注释的 SNP)。表 2-1:未去除低质量碱基各软件 SNP calling 结果Table 3-1: Non-removed low-mass bases Software SNPs软件Software覆盖度大于 3×SNP 数量Number of SNPdbSNP 数量Number of dbSNPNon-dbSNP 数量Number of non-dbSNP

【参考文献】:
期刊论文
[1]利用SSR标记和SNP芯片对小麦EMS突变体进行真实性鉴定[J]. 耿皆飞,王娜,蒋宏宝,刘录祥,许喜堂,魏红升,王成社,谢彦周.  核农学报. 2019(01)
[2]SNP检测方法在动物研究中的应用[J]. 赵杰,游新勇,徐贞贞,陈爱亮,赵燕,何雯菁,杨曙明.  农业工程学报. 2018(04)
[3]以关联分析发掘烟草抗赤星病基因分子标记[J]. 朱承广,任民,蒋彩虹,张雨生,孙明铭,刘旦,程立锐,杨爱国,王元英.  中国烟草科学. 2017(01)
[4]DNA测序技术方法研究及其进展[J]. 谢浩,赵明,胡志迪,王大巾,孟旭莉,丁先锋.  生命的化学. 2015(06)
[5]基于RNA-seq的百萨偃麦草染色体特异分子标记开发与应用[J]. 李晨旭,刘志涛,庄丽芳,亓增军.  中国农业科学. 2015(06)
[6]SNP检测方法的研究进展[J]. 许家磊,王宇,后猛,李强.  分子植物育种. 2015(02)
[7]第二代测序技术检测1例假肥大型肌营养不良家系Dystrophin基因突变[J]. 林颖,蒋涛,季修庆,成建,罗春玉,马定远,许争峰.  临床检验杂志. 2014(03)
[8]SNP基因分型检测技术及应用进展[J]. 杨春晓,张玉,师少军.  中国药师. 2013(06)
[9]SNP分子标记的研究及其应用进展[J]. 唐立群,肖层林,王伟平.  中国农学通报. 2012(12)
[10]下一代测序数据格式的研究展望[J]. 鲍婧.  电脑知识与技术. 2011(36)

硕士论文
[1]单细胞DNA测序数据的基因型和SNP检测[D]. 黄婧莹.华南理工大学 2018
[2]芸薹属蔬菜低深度测序SNP分型及其应用[D]. 付丽霞.中国农业科学院 2016
[3]玉米高通量测序数据SNP检测流程的优化及应用[D]. 李坦.南京农业大学 2015
[4]基于重测序数据的群体SNP位点检测及基因型判断[D]. 何伟明.华南理工大学 2013
[5]RAPD、SRAP和ISSR标记在香菇种质资源的应用及其SCAR标记的建立[D]. 应正河.福建农林大学 2006
[6]水稻苯达松敏感致死基因bel的精细定位[D]. 朱磊.南昌大学 2005



本文编号:3266598

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3266598.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户da853***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com