下一代测序技术在混合DNA分析中的应用研究
发布时间:2017-12-24 07:14
本文关键词:下一代测序技术在混合DNA分析中的应用研究 出处:《河北医科大学》2017年硕士论文 论文类型:学位论文
更多相关文章: 下一代测序 短串联重复序列 Ion PGM? 混合DNA 混合比例
【摘要】:目的:尽管这些年对于混合DNA的分型研究取得了一些进展,但仍有诸多问题未得到有效解决,混合DNA分型依然是当前法医遗传学研究的难点。鉴于传统毛细管电泳STR分型技术的局限性,不能充分挖掘混合DNA中蕴藏的遗传信息。近几年来,下一代测序技术(next generation sequencing,NGS)引起了法医学者的极大兴趣同时法医学者也正致力于将其向法医遗传领域应用的转化。下一代测序STR分型技术较毛细管电泳具有极大的优势,它既能观察各STR基因座的长度多态性信息,又能检测到各基因座序列多态性信息,从中发掘出更多信息,这为混合DNA解释提供了一个新的研究方向。因此,本研究拟采用Precision ID Global Filer NGS STR Panel在Ion Torrent PGM?平台进行测序分析,分为系列实验对其重复性、一致性、灵敏度进行实验室内部评价,在此基础上,利用NGS平台对构建的两男混合DNA样本进行测序分析,对混合DNA主要参数进行评估并采用本实验室自主研发的sep DNA软件进行分析,旨在为混合DNA解释提供参考。方法:1样本采集:取自河北省血液中心50份无关健康男性个体抗凝血样。3个标准品分别为9948 male DNA、2800 Control DNA和DNA Control 007。2 DNA提取:应用Relia Prep?Blood g DNA Miniprep System试剂盒提取血样DNA,采用Nano Q?微型分光光度计进行全基因组DNA纯度检测。3 DNA定量:应用Quantifiler?Human DNA Quantification Kit定量试剂盒对提取的全基因组DNA以及3个标准品采用7500 Real-time PCR System进行绝对定量。4样本准备4.1实验室评价部分:以9948 Male DNA标准品构建文库进行测序,平行实验3次进行重复性研究;以取自河北省血液中心17份无关健康男性个体抗凝血样和3个标准品测序进行一致性研究;以9948 Male DNA标准品绝对定量结果制备系列起始DNA模板量(1 ng、500 pg、200 pg、100 pg、50 pg)进行测序,每个样本平行实验2次进行灵敏度研究。4.2混合DNA部分:根据定量结果以DNA浓度非常接近为归类标准,将50个男性样本的DNA定量结果进行归类分组,选出其中符合标准的单一DNA样本构建4组两男混合DNA样本,每组混合样本设定4个混合比率(1:1、1:4、1:9和1:19)。每个混合样本平行实验两次。5文库构建:应用Precision ID Global Filer?NGS STR Panel和Precision ID Library Kit按照说明构建文库。除外灵敏度研究中采用制备的起始DNA模板量外,其余样本均稀释至1 ng/μl,采用1 ng起始DNA模板量构建文库。6模板制备:采用Ion PGM?Hi?Q?OT2 Kit在Ion One Touch?2System仪器上按照说明制备测序模板。7 Ion PGM?测序:采用Ion PGM?Hi?Q?STR Sequencing Kit,在Ion PGM?System按照手册说明进行测序操作。8测序数据处理:测序结果采用Ion Torrent Suite?以及附带的HID_STR_Genotyper和Coverage Analysis进行分析。9 CE-STR分型:所有单一样本同时采用Power Plex?Fusion System进行检测分型,用于与NGS-STR分型的比较。10结果分析:首先对分析阈值确定等位基因和过滤noise的效能进行评价。通过对样本Do C、基因座平均Do C、基因座序列构成比以及ACR等参数的计算和统计分析对测序数据进行评价。在此基础上对测序样本的重复性、一致性和灵敏度进行统计分析,综合评价在本实验室的效能。利用NGS平台对构建的两男混合DNA样本进行测序分析,对混合DNA主要参数进行评估并采用本实验室自主研发的sep DNA软件进行分析。结果:1 Precision ID Global Filer?NGS STR Panel的实验室评价:1.1分析阈值在默认分析阈值(即AT=5%)能过滤掉绝大多数noise序列达到较好的效能。1.2数据质量分析数据质量参数经统计显示,样本平均Do C为2535×;基因座平均Do C为2542×;在基因座序列构成比中,基因座%allele平均为90.83%,%stutter平均为4.22%,%noise平均为5.21%;STR基因座ACR平均为0.76,有2个基因座(D12S391和D12ATA63)平均ACR0.6。1.3重复性研究3次重复间等位基因分型一致并且%Allele和ACR均无显著性差异。1.4一致性研究在CE-STR与NGS-STR可比较的761个等位基因中有758(99.61%)个等位基因分型一致,两者有3(0.39%)个等位基因在D18S51出现不一致性分型。同时在D2S441、D1S1656、D8S1179、D3S1358、v WA、D21S11、D2S1338和D12S391等8个基因座检出同等位基因。1.5灵敏度研究在默认分析阈值下,起始DNA模板量低至100 pg时等位基因仍可被完全检出;起始DNA模板量为50 pg时等位基因发生较多的dropout,等位基因检出率为88.68%。不同起始DNA模板量ACR显示,起始DNA模板量低至100 pg,平均ACR为0.598,仍能得到较好的均衡性。随着起始模板量的降低,平均ACR从0.729降至0.329,CV从23.95%增至98.21%。2 Precision ID Global Filer?NGS STR Panel对混合DNA分型的研究:混合DNA研究中8个单一样本构建4组混合样本,每组混合样本设置4个不同混合比率,总共含有16个混合样本,每个混合样本平行实验2次。计算每个样本平均等位基因检出个数时按照四舍五入取整数的方式进行等位基因计数。2.1等位基因的序列信息进行同等位基因的区分NGS-STR可以检测等位基因的序列差异进行同等位基因的区分。例如,观察到在混合比率1:9,v WA基因座次要组分(14,17)和主要组分(17,18)共享等位基因17。利用序列差异,次要组分等位基因17能够从主要组分等位基因中得到区分;D1S1656基因座次要组分(11,14)的等位基因11与主要组分(12,15)等位基因12的n-1 stutter重叠,利用序列差异可以将两者进行区分。2.2各混合比率样本基因座平均Do C在混合比率为1:1时,基因座平均Do C最低为451±130×(FGA),最高为7263±2105×(Amelogenin)。在混合比率为1:4时,基因座平均Do C最低为698±222×(FGA),最高为10636±3520×(TPOX)。在混合比率为1:9时,基因座平均Do C最低为565±223×(D3S4529),最高为9249±1640×(TPOX)。在混合比率为1:19时,基因座平均Do C最低为563±214×(D3S4529),最高为10571±2176×(TPOX)。2.3不同混合比率等位基因检出情况在混合比率为1:1、1:4、1:9和1:19时,默认分析阈值下每个混合比率总的等位基因检出数目分别为365、354、309和281个,分别有0、0、7和15个等位基因丢失,等位基因检出率分别为100%,96.98%、84.66%和76.99%。在混合比率为1:1、1:4、1:9和1:19时,每个混合比率的次要组分未共享等位基因分别共检出134、134、130和121个,在默认分析阈值下分别共检出134、124、78和49个,检出率分别为100%、92.54%、60.00%和40.50%。2.4混合DNA主要参数评估2.4.1混合DNA杂合型均衡比(H_b)混合样本主要组分平均H_b在每个混合比率展现了较好的均衡性,在4个混合比率中平均H_b最小值为0.70,最大值为0.78。在混合比率为1:1和1:4时,次要组分平均H_b分别为0.73和0.67,均呈现出较好的均衡性;在混合比率为1:9和1:19时,H_b呈现较大变异甚至发生杂合性丢失,平均H_b分别为0.54和0.45。2.4.2 D值和实测混合比例(Mx1)分析Mx分析中基因座D值分布显示所有基因座绝大部分数据位于D值0.2且基因座Do C4000×的区间内,其中82%的基因座D值0.1,93%的基因座D值0.15。除1:1外,其余混合比率绝对部分D值均0.1。混合比率为1:1时,4个样本Mx1最小值为0.47,最大值为0.49;混合比率为1:4时,4个样本Mx1最小值为0.16,最大值为0.19;混合比率为1:9时,4个样本Mx1最小值为0.08,最大值为0.12;混合比率为1:19时,4个样本Mx1最小值为0.05,最大值为0.07。混合比率从1:1降低至1:19时,变异系数从27.21%增至54.19%。2.5 sep DNA软件分析—分离准确率2.5.1整体分离准确率在最优基因型,Bayes和Iter数学模型的分离准确率分别为64.91%;和64.28%;两者分离准确率没有显著性差异(P=0.7734)。在考虑备选基因型后,Bayes和Iter数学模型的分离准确率分别为74.18%和71.13%,两者分离准确率没有显著性差异(P=0.1353)。2.5.2不同混合比率分离准确率在最优基因分型时,Bayes数学模型在1:1、1:4、1:9和1:19的分离准确率分别为52.15%、75.76%、72.40%和65.05%;Iter数学模型在在1:1、1:4、1:9和1:19的分离准确率分别为50.14%、75.36%、72.39%和65.07%。在考虑备选基因型分型后,Bayes数学模型在1:1、1:4、1:9和1:19的分离准确率分别为65.17%、84.87%、81.73%和73.20%;Iter数学模型在在1:1、1:4、1:9和1:19的分离准确率分别为58.82%、83.74%、79.10%和68.08%。2.5.3等位基因共享对分离准确率的影响Bayes数学模型进行分析,在最优基因型时,有共享基因座的分离准确率为60.00%,未共享基因座的分离准确率为71.83%,两者存在显著性差异(P=0.0002);在考虑备选基因型后,有共享基因座的分离准确率为70.81%,未共享基因座的分离准确率为78.93%,两者存在显著性差异(P=0.0048),提示在两种情形下未共享基因座的分离准确率均显著高于共享基因座。Iter数学模型进行分析,在最优基因型时,有共享基因座的分离准确率为59.64%,未共享基因座的分离准确率为70.81%,两者存在显著性差异(P=0.0004);在考虑备选基因型分型后,有共享基因座的分离准确率为66.67%,未共享基因座的分离准确率为77.41%,两者存在显著性差异(P=0.0003),提示在两种情形下未共享基因座的分离准确率显著高于共享基因座。结论:1 Precision ID Global Filer NGS STR Panel结合Ion Torrent PGM?平台在本实验室展现了良好的表现可以成功地应用于STR分析。2应用NGS技术进行混合DNA的STR分型,较CE-STR分型技术可获得更多有价值的信息如同等位基因,甚至混合比率低至1:19时次要组分部分等位基因仍可检出。应用本实验室研发的sep DNA软件对NGS-STR混合DNA分型结果进行分析,结果表明以等位基因reads数目作为定量信息进行混合DNA分析是可行的。
【学位授予单位】:河北医科大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:D919.4
【参考文献】
相关期刊论文 前1条
1 王乐;叶健;白雪;杨帆;赵兴春;;二代测序技术及其在法医遗传学中的应用[J];刑事技术;2015年05期
,本文编号:1327380
本文链接:https://www.wllwen.com/shoufeilunwen/shuoshibiyelunwen/1327380.html