当前位置:主页 > 医学论文 > 特种医学论文 >

从全基因组测序结果中提取Y染色体DNA遗传标记信息的方法研究

发布时间:2020-06-06 07:45
【摘要】:背景和目的人类Y染色体的很大一部分,即非重组Y染色体部分(Non-recombinant Y chromosome NRY),遵从严格的父系遗传。由于在减数分裂过程中Y染色体该部分没有重新组合,因此可以确定所有人类NRY变体的等级血统顺序并推断它们在系统发育树中血统的顺序和时间。然而在父子遗传信息一代代的传递过程中,Y染色体也在渐渐地积累着一些变化——遗传突变。正是因为遗传突变积累的存在,使得人类父系遗传的体系中,相距越远的两个个体Y染色体差异越大;正是这些遗传突变的积累,形成了Y染色体遗传标记。Y染色体上的遗传标记有很多,主要有微卫星DNA、小卫星DNA、卫星DNA、插入与缺失、单核苷酸多态性五类。目前在法医学研究中以及实际检案中最常用到的是微卫星DNA和单核苷酸多态性,即Y-STR和Y-SNP。并且,随着下一代测序(Next generation sequencing NGS)的快速发展,以及测序成本的降低,未来几年将有大量人类基因组数据可供使用。这些数据可用于优化和提高Y染色体系统发育树的分辨率。但是NGS产生的数据量急剧增加,并且产生的数据格式较为复杂,对法医学实践中需要提取某一位点信息的需求形成严峻挑战。为了有效地分析和阐释Y染色体NGS数据,本实验通过对STRait Razor v3、AMY-tree及Y-leaf三个软件来解析全基因组DNA二代测序结果数据,以比较各软件的效力,能够为从二代测序结果中Y-STR信息和提取高分辨率Y-SNP单倍群提供方法参考,并能为法医物证工作中应用二代测序技术获取Y-DNA遗传标记提供帮助。方法1.采用上海莱枫公司2ml血液基因组DNA提取试剂盒提取一名河南汉族男性外周血基因组DNA。2.以二代测序仪BGISEQ-500对该例样品进行全基因组DNA重测序。3.提取二代测序结果中的Y-STR信息:使用STRait Razor v3软件包。在Windows操作系统上,从https://github.com/Ahhgust/STRaitRazor页面下载并安装STRait Razor v3软件包。把二代测序结果.fastq文件通过该软件解读出.fastq文件中所包含的Y染色体STR等信息。4.提取二代测序结果中的特异性Y-SNP信息:使用AMY-tree软件;并以之判断该样品在Y单倍群进化树(International Society of Genetic Genealogy,ISOGG,http://www.isogg.org/tree)中的分支归属。从bio.kuleuven.be/eeb/lbeg下载并安装AMY-tree软件在Windows操作系统上。将全基因组DNA重测序结果中的Y染色体突变列表按照AMY-tree软件要求格式修改成输入文件,对软件所需其他支持文件下载并输入,运行程序,得出样本所属ISOGG单倍群分支以及最新潜在Y-SNP等信息。5.提取测序结果中的特异性Y-SNP信息:使用Y-leaf软件;并以之判断该样品在Y单倍群进化树(International Society of Genetic Genealogy,ISOGG)中的分支归属。在https://www6.erasmusmc.nl/genetic_identification/resources/Yleaf/下载Y-leaf软件,在Linux操作系统上,根据y-leaf软件的README文件进行安装。提前安装好Python、wget、Libcurl、readline、R、samtools等基础支持软件包。然后在郑州大学超算中心上运行y_leaf来分析二代测序结果bam或fastq文件,解读其中的Y-SNPs及其单倍群。6.以Yfiler试剂盒对该样品进行检测;对该样品进行M117分型,以验证提取的遗传标记信息。7.以STRAIT Razor v3识别出的Y-STR个数,与Yfiler试剂盒检测出的Y-STR个数相比,求出全基因组测序50×背景下的Y-STR检出率;以AMY-tree识别出Y单倍群进化树SNP个数除以输入该软件的Y-SNPs总数,求其Y-SNP识别率;以Yleaf识别出Y单倍群进化树SNP个数除以输入该软件的Y-SNPs总数,求其Y-SNP识别率。并以卡方检验比较AMY-tree与Yleaf从全基因组数据中提取Y-DNA遗传标记信息的效力。结果1.全基因组重测序得到3429964个SNP,其中98.77%出现在dbSNP数据库里,其中96.98%在千人基因组计划(the 1000 Genomes Project)的数据库中。在全基因组中新发现的SNP共32050个。Y染色体上得到2825个SNP。2.STRait Razor v3软件包的Powerseq.config组件分析的STR位点和性别信息结果显示,获得48742条性别信息(Amelogenin基因)和236条STRs分型结果,其中Y-STR信息49条(常染STR187条)。软件读出的6个Y-STR及其判型结果与Yfiler试剂盒检测结果基本一致。3.AMY-tree解析结果为单倍群为O2a2c2c*[O-Page23*],比起该样品的电泳检测结果(M117衍生型,指示该样品属于单倍群进化树分支O2a2b1a1)不完全一致。这是因为AMY-tree的数据库还是2014年数据,没能及时更新的原因。4.Yleaf输出结果为在Y染色体上共比对出41392个Y-SNPs,共有908个Y-SNPs是衍生型,指示出该样品属于O2a2b1a1a1a1a分支,比起该样品的电泳检测结果(M117衍生型,指示该样品属于单倍群进化树分支O2a2b1a1)更为具体。5.在全基因组测序50×所产生的数据中,用STRAIT Razor v3、AMY-tree及Y-leaf提取相关Y-DNA遗传标记信息时的检出率/识别率分别为35%、73%及99%。AMY-tree及Yleaf对Y-SNPs的识别效力有显著性差异,以Yleaf更为准确。结论1.STRait Razor v3软件包直接从全基因组测序结果中提取出相关Y-STR甚至常染色体STR信息。且其工作平台可为Windows操作系统,安装简便,运行可靠,可供目前的法医DNA实验室常规使用。2.Y-leaf是一种适用于从所有类型的Y染色体NGS数据进行准确、高分辨率的单倍群推断的软件。3.基于下一代测序的STR分型在现有数据输出方式基础上,对STR基因座进行全解析度分型,进一步关注STR内部的序列多态性,显著提升STR基因座的个体识别能力。基于NGS技术进行STR分型的技术路线是可行的。4.比较各软件的效力,能够为从二代测序结果中提取Y-STR信息和提高Y-SNP单倍群分辨率提供方法参考,为法医物证工作中应用二代测序技术获取Y-DNA遗传标记提供帮助。5.常规全基因组测序结果难以足额提供法医DNA遗传标记,出于法医应用目的的二代测序技术应该有别于常规的全基因组测序或全外显子测序等技术。
【图文】:

示意图,测序,示意图


二代测序片段拼接示意图(引自NovelBioinformatics)

格式,示例,壁垒,实战


从法医学实战的角度来看,不仅是巨大的数据量,而且复杂的数据格式也对其广泛应用形成了天然壁垒。二代测序产生的文件,主要有.fastq 和.bam 两种格式。.fastq 格式的文件格式内容见图 2.
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:D919

【相似文献】

相关期刊论文 前10条

1 ;第十二次全国畜禽遗传标记学术研讨会征文通知[J];遗传;2010年06期

2 王桂朝;;生命科学的舞台——畜禽遗传标记——畜禽遗传标记学分会第十一次学术研讨会青岛召开[J];中国家禽;2008年21期

3 ;第十一次全国畜禽遗传标记学术研讨会将在青岛召开[J];遗传;2008年07期

4 陈宏;第八次全国畜禽遗传标记学术研讨会在杨凌召开[J];遗传学报;2002年12期

5 陈宏;第八次全国畜禽遗传标记学术研讨会在杨凌召开[J];遗传;2002年06期

6 ;第八次全国畜禽遗传标记学术研讨会在我校召开[J];黄牛杂志;2002年06期

7 ;第七次全国畜禽遗传标记研讨会召开[J];遗传;2001年01期

8 周延清;遗传标记的发展[J];生物学通报;2000年05期

9 徐宁迎;遗传标记简介[J];浙江畜牧兽医;1999年01期

10 徐宁迎;遗传标记多态性的意义及常用评定指标[J];浙江畜牧兽医;1999年02期

相关会议论文 前10条

1 丁晓东;睢薇;吕柳新;;遗传标记、连锁图谱及其在果树上的研究进展[A];中国园艺学会第四届青年学术讨论会论文集[C];2000年

2 胡志昂;;对我国遗传多样性研究的几点意见[A];生物多样性研究进展——首届全国生物多样性保护与持续利用研讨会论文集[C];1994年

3 杨关福;;前言[A];第十次全国畜禽遗传标记研讨会论文集[C];2006年

4 郑勇奇;于默奥;;遗传标记和数量性状在林木基因保存中的应用[A];面向21世纪的中国林木遗传育种——中国林学会林木遗传育种第四届年会文集[C];1997年

5 叶俊华;杨前勇;;犬DNA遗传标记技术研究现状及应用前景[A];第十一次全国养犬学术研讨会论文集[C];2005年

6 李积友;;遗传标记研究现状及其在绵羊业生产中的应用研究[A];动物生理生化学分会第八次学术会议暨全国反刍动物营养生理生化第三次学术研讨会论文摘要汇编[C];2004年

7 孙伟;常洪;任战军;杨章平;;相同遗传背景下不同层次遗传标记检测效率的比较[A];全国畜禽遗传资源保护与利用学术研讨会论文集[C];2005年

8 高芳琳;;InDeI多态性遗传标记的研究进展[A];第一次全国中西医结合检验医学学术会议暨中国中西医结合学会检验医学专业委员会成立大会论文汇编[C];2014年

9 李积友;;遗传标记在养羊业生产中的应用研究现状及展望[A];第十次全国畜禽遗传标记研讨会论文集[C];2006年

10 吴显达;朱翔杰;徐新建;周冰峰;;微卫星遗传标记在蜜蜂种群遗传学研究中的应用[A];中国养蜂学会蜜蜂饲养管理专业委员会第十三次学术研讨会论文集[C];2007年

相关重要报纸文章 前10条

1 记者 鄢玫;第七次全国畜禽遗传标记学术研讨会在昌举行[N];江西日报;2000年

2 记者 胡德荣;亚洲人源于非洲又添佐证[N];健康报;2001年

3 朱进;神奇的DNA技术[N];人民公安报;2008年

4 本报记者 李金金;基因揭秘:我们来自南方[N];北京科技报;2010年

5 本报记者 冯卫东;“聪明”基因,千万里我追寻着你[N];科技日报;2008年

6 [法]奥利维耶·科斯塔 娜塔莉·布拉格 译 潘革新;欧盟是怎样运作的[N];中国经济导报;2016年

7 复旦大学生命科学学院教授 博士生导师 金力;写在基因中的历史[N];文汇报;2010年

8 记者 李晶;“中国四大谜案”之首白银案 靠什么技术锁定真凶?[N];北京科技报;2016年

9 中国医科大学法医学院教授 王保捷;Y染色体 法医鉴定的好帮手[N];健康报;2016年

10 记者 李婵;在哪里更易邂逅同姓[N];北京科技报;2012年

相关博士学位论文 前9条

1 Olowofeso Olajide;[D];扬州大学;2005年

2 林志华;文蛤种质资源的遗传基础及利用的研究[D];中国海洋大学;2007年

3 张国彦;东方粘虫微卫星富集文库的构建与遗传标记筛选[D];南京农业大学;2009年

4 孙红英;中华绒螯蟹线粒体基因组与16S rDNA遗传标记研究[D];南京师范大学;2002年

5 王明辉;[D];复旦大学;2008年

6 蒙子宁;中国近海小黄鱼、带鱼和小带鱼的遗传多样性以及八种石首鱼类的分子系统进化[D];厦门大学;2003年

7 马维军;基因定位的统计方法研究[D];东北师范大学;2011年

8 孙世龙;中国汉族人群精神分裂症相关基因的遗传学研究[D];吉林大学;2009年

9 林红;远缘杂交法结合RAPD技术对鲢、团头鲂遗传图谱的构建[D];南京农业大学;2000年

相关硕士学位论文 前10条

1 郭仲谦;从全基因组测序结果中提取Y染色体DNA遗传标记信息的方法研究[D];郑州大学;2019年

2 季晶焱;贵州水族遗传标记多态性调查及族源探究[D];贵州医科大学;2017年

3 马腾;性染色体多态性遗传标记的法医遗传学研究[D];复旦大学;2013年

4 孙宽;X染色体插入缺失遗传标记的法医学研究[D];复旦大学;2014年

5 王晶娟;中药材及其复方DNA遗传标记鉴定方法研究[D];黑龙江中医药大学;2002年

6 袁巍;鹿类动物物种特异性遗传标记的研究[D];东北林业大学;2002年

7 桂枝;苜蓿抗褐斑病遗传标记的研究[D];甘肃农业大学;2001年

8 汤栩宁;基于单体型的致病基因区域发现算法研究[D];吉林大学;2008年

9 黄夕洋;罗汉果性别性状的遗传标记研究[D];广西师范大学;2006年

10 吴易雄;猪的产肉性能及其遗传标记筛选研究[D];湖南农业大学;2002年



本文编号:2699374

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yundongyixue/2699374.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户68421***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com