DNA低频突变检测生信方法建立
发布时间:2021-09-04 00:16
过去的十几年,得益于二代测序技术(next generation sequencing,NGS)的迅速发展,基于NGS的DNA突变检测技术不断发展成熟,但常规NGS的高错误率阻碍了其在检测低频突变中的应用。目前低频突变检测技术主要应用于检测循环游离DNA(circulating cell-free DNA,cfDNA),然而血液中的cfDNA含量很少,以及包括DNA扩增和测序在内的实验过程会引入背景噪音,导致检测假阳性。循环肿瘤DNA(circulating tumor DNA,ctDNA)是由肿瘤细胞产生的一类cfDNA,基于ctDNA的突变检测可用于癌症筛查、基因分型、疾病实时监测。但是,在大多数早期和部分中晚期实体瘤中,ctDNA的含量非常低,造成对ctDNA的检测和生信分析变得极具挑战性。为了克服这些限制因素,我们基于Duplex Sequencing策略,结合基于机器学习的背景抛光技术和改进版分子条形码技术(home-developed unique molecular identifiers,dUMI),开发了一种cfDNA低频突变分析算法——Mutseek,可以将碱基总体...
【文章来源】:上海师范大学上海市
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图1-1分子诊断主流技术平台分子诊断技术在过去的近50年里发展迅猛,70年代末Kan[1]等人应用DNA
上海师范大学硕士学位论文前言41.2.2DNA低频突变检测的瓶颈不同于DNA高频突变,DNA低频突变的鉴定一直是个难题,一方面,由于高通量测序的测序系统信号识别等环节不可避免地会引入错误,目前NGS中最常用的Illumina测序平台的单碱基错误率在~0.1%水平[4];另一方面,文库构建即使用高保真的酶进行PCR扩增,也存在约10-6的扩增错误率,随着PCR循环数增加,错误率也随着上升[5];另外DNA分子损伤和降解也会增加碱基错误率,这三方面的因素导致对DNA突变进行分析时存在强烈的背景噪音,干扰检测结果。当DNA突变频率小于1%时,分析人员很难将真实突变与系统错误区分开,导致检测灵敏度较差。图1-2外周血中的cfDNA来源循环游离DNA(circulatingcell-freeDNA,cfDNA)是血液循环或其它体液中游离于细胞外的DNA片段,目前普遍认为cfDNA主要来源于凋亡、衰老的血细胞释放的DNA碎片,在某些疾病和特殊状态下,其它细胞也会释放DNA到血液中,比如肿瘤细胞来源的循环肿瘤DNA(circulatingtumorDNA,ctDNA)[6]。Mandel和Metais[7]于1948年首次在外周血中发现了cfDNA,随着对它的深入了解,cfDNA被应用于产前诊断、免疫性疾病分析、癌症筛查及诊断等领域,尤其是在肿瘤个性化治疗领域具有巨大的应用价值,现在cfDNA已经成为液体活检最重要的分子标志物之一。然而,无论是肿瘤患者还是孕妇的外周血cfDNA样本中,由于现阶段我们无法单独获取ctDNA或者胎儿游离DNA片段,且这些目标DNA在血浆总DNA
上海师范大学硕士学位论文前言100.003%(突变检测灵敏度为53%)图1-3DuplexSequencing技术原理除了基于PCR技术,利用探针对目标序列进行杂交捕获富集,是靶向测序的另外一种策略。所谓探针就是体外合成的一段寡核苷酸,其序列可以根据自身需求进行合成,我们利用与靶标DNA模板互补的探针,使之能特异性的结合靶标DNA,然后通用beads的吸附作用来富集靶标DNA。靶向测序中最具代表性的就是WES测序,它针对整个基因组上的所有外显子区域设计探针,与WGS相比,WES将基因组上的非编码区剔除,保留了最核心、关键的外显子区域,编码蛋白的大部分信息都存在于该区域,与人类表型相关的主要功能性突变也都在这些区域,这就在满足大部分研究及临床检测的前提下,大大降低了测序和分析的费用[44][45]。目前使用比较广泛的商业捕获探针包括安捷伦公司出品的AgilentSureSelectHumanAllExon以及罗氏出品的SeqCapEZHumanExomeLibraryv3.0等。2014年美国斯坦福大学Newman[46]等人研发了一种CAPP-Seq的技术,其原理是首先利用肿瘤基因突变数据库(CatalogueofSomaticMutationsinCancer,COSMIC)筛选与非小细胞肺癌(NSCLC)相关且重复出现的突变基因位点,以确定设计探针的区域,这一策略有效的缩小了测序范围,这样才能实现超高深度测序。然后针对这些靶区域设计并合成探针,达到捕获靶标DNA的目的。CAPP-Seq可以检测到多种突变,包括单碱基突变,染色体重排和拷贝数变异等,它对ctDNA定量十分敏感,将其应用到NSCLC样品中,通过对ctDNA文库进行超深度测序(10000x),发现超过95%的肿瘤样本能够鉴定出突变,其中对Ⅰ期和Ⅱ~Ⅳ期NSCLC的检测敏感性分别达到50%和100%[46];该技术能检测
本文编号:3382159
【文章来源】:上海师范大学上海市
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图1-1分子诊断主流技术平台分子诊断技术在过去的近50年里发展迅猛,70年代末Kan[1]等人应用DNA
上海师范大学硕士学位论文前言41.2.2DNA低频突变检测的瓶颈不同于DNA高频突变,DNA低频突变的鉴定一直是个难题,一方面,由于高通量测序的测序系统信号识别等环节不可避免地会引入错误,目前NGS中最常用的Illumina测序平台的单碱基错误率在~0.1%水平[4];另一方面,文库构建即使用高保真的酶进行PCR扩增,也存在约10-6的扩增错误率,随着PCR循环数增加,错误率也随着上升[5];另外DNA分子损伤和降解也会增加碱基错误率,这三方面的因素导致对DNA突变进行分析时存在强烈的背景噪音,干扰检测结果。当DNA突变频率小于1%时,分析人员很难将真实突变与系统错误区分开,导致检测灵敏度较差。图1-2外周血中的cfDNA来源循环游离DNA(circulatingcell-freeDNA,cfDNA)是血液循环或其它体液中游离于细胞外的DNA片段,目前普遍认为cfDNA主要来源于凋亡、衰老的血细胞释放的DNA碎片,在某些疾病和特殊状态下,其它细胞也会释放DNA到血液中,比如肿瘤细胞来源的循环肿瘤DNA(circulatingtumorDNA,ctDNA)[6]。Mandel和Metais[7]于1948年首次在外周血中发现了cfDNA,随着对它的深入了解,cfDNA被应用于产前诊断、免疫性疾病分析、癌症筛查及诊断等领域,尤其是在肿瘤个性化治疗领域具有巨大的应用价值,现在cfDNA已经成为液体活检最重要的分子标志物之一。然而,无论是肿瘤患者还是孕妇的外周血cfDNA样本中,由于现阶段我们无法单独获取ctDNA或者胎儿游离DNA片段,且这些目标DNA在血浆总DNA
上海师范大学硕士学位论文前言100.003%(突变检测灵敏度为53%)图1-3DuplexSequencing技术原理除了基于PCR技术,利用探针对目标序列进行杂交捕获富集,是靶向测序的另外一种策略。所谓探针就是体外合成的一段寡核苷酸,其序列可以根据自身需求进行合成,我们利用与靶标DNA模板互补的探针,使之能特异性的结合靶标DNA,然后通用beads的吸附作用来富集靶标DNA。靶向测序中最具代表性的就是WES测序,它针对整个基因组上的所有外显子区域设计探针,与WGS相比,WES将基因组上的非编码区剔除,保留了最核心、关键的外显子区域,编码蛋白的大部分信息都存在于该区域,与人类表型相关的主要功能性突变也都在这些区域,这就在满足大部分研究及临床检测的前提下,大大降低了测序和分析的费用[44][45]。目前使用比较广泛的商业捕获探针包括安捷伦公司出品的AgilentSureSelectHumanAllExon以及罗氏出品的SeqCapEZHumanExomeLibraryv3.0等。2014年美国斯坦福大学Newman[46]等人研发了一种CAPP-Seq的技术,其原理是首先利用肿瘤基因突变数据库(CatalogueofSomaticMutationsinCancer,COSMIC)筛选与非小细胞肺癌(NSCLC)相关且重复出现的突变基因位点,以确定设计探针的区域,这一策略有效的缩小了测序范围,这样才能实现超高深度测序。然后针对这些靶区域设计并合成探针,达到捕获靶标DNA的目的。CAPP-Seq可以检测到多种突变,包括单碱基突变,染色体重排和拷贝数变异等,它对ctDNA定量十分敏感,将其应用到NSCLC样品中,通过对ctDNA文库进行超深度测序(10000x),发现超过95%的肿瘤样本能够鉴定出突变,其中对Ⅰ期和Ⅱ~Ⅳ期NSCLC的检测敏感性分别达到50%和100%[46];该技术能检测
本文编号:3382159
本文链接:https://www.wllwen.com/projectlw/swxlw/3382159.html
教材专著