基于SMRT测序技术的药用植物遗传序列研究
本文关键词:基于SMRT测序技术的药用植物遗传序列研究
更多相关文章: 单分子实时DNA测序 药用植物 基因组 叶绿体 转录组
【摘要】:我国药用植物资源丰富,但由于种类繁多且遗传背景复杂等原因,药用植物的基因组学与转录组学研究难度较大,目前整体尚处于起步阶段,先进测序技术和分析手段应用的欠缺是导致这一现状的重要因素。单分子实时(single molecule real-time, SMRT)DNA测序技术,是通过大规模实时记录单个DNA聚合酶在零模波导(zero-mode waveguide, ZMW)纳米孔中以样品DNA为复制模板催化DNA合成的过程,获得样品DNA碱基序列信息的高通量DNA测序技术。在DNA测序技术的发展历史中,SMRT属于第三代,也是目前世界上最先进的DNA测序技术,自2009年问世以来,助力解决了生物学和医学领域诸多重要问题。SMRT的技术原理对解决高通量测序时代药用植物学研究领域的一些关键问题具有显著优势,但相关研究尚属空白。本文以重要药用植物以及药用真菌为例,进行了基于SMRT测序技术的药用植物基因组混合组装、叶绿体全基因组序列组装、全长转录本测序的实验研究。基因组序列是进行药用植物系统生物学研究的基础,本研究的第一部分以模式药用植物丹参(Salvia miltiorrhiza)为例,应用SMRT测序技术对丹参的基因组长片段(8-10kb)随机打断文库进行测序。实验中所使用的二倍体丹参预测的基因组大小约为615Mb,基因组构成复杂,本研究在已有下一代测序技术(next generation sequencing, NGS)数据的基础上,引入约4Gb长度大于2000bp的矫正过的long reads(来自约8GB的SMRT测序数据),并采取基于long reads的混合拼接策略进行组装。获得了60,349个contig,平均contig长度为8.69kb,contig的N50长度为12.4kb,序列总长度为524 Mb,覆盖85%预测到的丹参基因组。加入mate-pair数据后,得到21,045条scaffold,平均scaffold长度为25.56kb,scaffold的N50长度为51.02kb,最长scaffold为388.31kb,序列总长度为538Mb, BAC文库的测序结果验证了序列与组装的准确性。与已有的Ilumina、454单独拼接的结果进行比较,原碎片化的拼接结果得到大幅度改善,并应用于后续丹参酚酸生物合成基因的挖掘与分析,证明SMRT测序技术的介入可以显著提高复杂药用植物基因组的拼接质量。叶绿体基因组序列是药用植物超级条形码(super-barcode)鉴定的研究基础,也是研究叶绿体基因工程、叶绿体序列分子标记开发以及植物系统发育研究的重要数据来源。本研究的第二部分内容是以贝母属三种药用植物湖北贝母(Fritillaria hupehensis)、太白贝母(Fritillaria taipaiensis)和卷叶贝母(Fritillaria cirrhosa)为例,分别于群落中采集多个植株的叶片进行混合,构建短片段插入文库进行基于环状一致测序策略(circular consensus sequencing, CCS)的SMRT测序,全程无PCR引入,在不使用参考基因组的前提下拼接得到了每个物种的叶绿体全基因组一致序列,经Sanger测序验证了测序和拼接的准确度为100%,且验证序列中变异频率低于15%的单核苷酸多态性位点(single nucleotide polymorphism, SNP)均得到了验证。叶绿体基因组序列分析显示,三种贝母属药用植物的叶绿体基因组均呈典型的四分体结构,长度在151,691bp至152,145bp范围内,编码135个基因,8个rRNA基因,38个tRNA基因,18个基因含有内含子,infA、ycf15和ycf68基因中间发现终止密码子,在贝母中可能是假基因。其中太白贝母叶绿体基因组中发现了20个SNP位点,变异频率在9.38%-45.45%之间;卷叶贝母叶绿体基因组中发现了70个SNP位点,变异频率在9.60%-50.00%之间,提示了川贝母群落可能存在的SNPs分布特征。此外,本研究也通过比较基因组的研究手段,对贝母属药用植物超级条形码的相关研究进行了有益的探索,物种间的叶绿体基因组序列比较分析给出了种间变异较大的基因,基于叶绿体基因组序列的百合目系统进化分析给出了黑药花科(Melanthiaceae)更接近于百合目基部的新证据。研究结果显示,SMRT-CCS策略在药用植物叶绿体基因组全序列获取上具有巨大优势和普遍推广意义。转录组数据是研究药用植物功能基因、次生代谢调控机制的重要基础。本研究的第三部分以本课题组已发布基因组数据的药用真菌灵芝(Ganoderma lucidum)为研究对象,设计总mRNA均一化后分片段构建文库的策略,使用SMRT测序技术直接对反转录得到的灵芝子实体期全长cDNA进行测序,并以灵芝P450基因家族进行生物信息学验证,结果显示本方案的转录组覆盖度良好,具有较强的全长转录本测序能力,克服了已有的高通量转录组测序技术无法直接从5’到3’完整描述RNA信息从而真实地反应RNA异构体信息的弊端,并提示灵芝转录组中大量可变剪接现象的存在。分析结果也反映出,在SMRT测序技术的现有能力下,全长转录本的序列准确性需要进一步提高以适应后续分析。综上所述,本文以重要药用植物和药用真菌为例,进行了基于SMRT测序技术的药用植物基因组学与转录组学的开创性研究,分别提出了行之有效的实验策略与分析方法。总之,SMRT测序技术在药用植物学研究领域具有重要价值和巨大的应用潜力,有助于推动我国传统药学进入生命科学研究前沿领域,在药用植物优良品种选育、药用植物分子鉴定和次生代谢产物合成路径解析等方面产生巨大影响。
【关键词】:单分子实时DNA测序 药用植物 基因组 叶绿体 转录组
【学位授予单位】:北京协和医学院
【学位级别】:博士
【学位授予年份】:2015
【分类号】:R282.71
【目录】:
- 摘要6-8
- ABSTRACT8-11
- 第一章 前言11-34
- 1.1 SMRT测序技术概述12-20
- 1.1.1 技术原理12-14
- 1.1.2 技术优势14-17
- 1.1.3 重要应用领域17-20
- 1.2 植物基因组DE NOVO组装策略概述20-25
- 1.2.1 测序前期工作22-23
- 1.2.2 测序策略23-24
- 1.2.3 组装策略24-25
- 1.3 叶绿体基因组研究概述25-31
- 1.3.1 叶绿体基因组结构特点25-28
- 1.3.2 基于叶绿体基因组序列的植物DNA条形码研究28-31
- 1.4 转录组测序技术概述31-34
- 第二章 可行性分析与研究意义34-44
- 2.1 SMRT测序技术辅助复杂植物基因组组装研究34-37
- 2.2 基于SMRT-CCS策略的贝母叶绿体基因组研究37-39
- 2.3 基于SMRT测序技术的灵芝全长转录本研究39-44
- 第三章 研究材料与方法44-72
- 3.1 材料、试剂与设备44-47
- 3.1.1 材料44-45
- 3.1.2 试剂45-46
- 3.1.3 设备46-47
- 3.2 方法47-72
- 3.2.1 丹参总DNA提取47-48
- 3.2.2 贝母叶绿体分离及叶绿体基因组DNA提取48-49
- 3.2.3 灵芝子实体总RNA提取,cDNA合成与均一化,片段筛选49-57
- 3.2.4 SMRT短片段(500bp-3kb)文库构建与上机测序57-62
- 3.2.5 SMRT长片段(3kb-10kb)文库构建与上机测序62-66
- 3.2.6 序列拼接与分析66-72
- 第四章 结果与分析72-96
- 4.1 丹参基因组SMRT测序及辅助组装72-75
- 4.1.1 丹参基因组SMRT测序72
- 4.1.2 SMRT CLR辅助丹参基因组组装与验证72-75
- 4.2 贝母叶绿体基因组分析75-89
- 4.2.1 贝母属三种药用植物叶绿体基因组测序75-78
- 4.2.2 贝母属三种药用植物叶绿体基因组基本特征78-83
- 4.2.3 贝母属三种药用植物叶绿体基因组比较83-84
- 4.2.4 百合目叶绿体基因组序列比较84-87
- 4.2.5 测序拼接策略与准确度验证87-89
- 4.3 灵芝子实体全长转录本分析结果89-96
- 4.3.1 灵芝子实体总RNA质控结果90-91
- 4.3.2 灵芝子实体SMRT测序数据91-93
- 4.3.3 灵芝子实体全长转录本鉴别93-94
- 4.3.4 灵芝子实体全长转录本cluster94-95
- 4.3.5 生物信息学验证95-96
- 第五章 讨论与结论96-103
- 5.1 丹参基因组组装研究96-98
- 5.2 基于SMRT-CCS策略的药用植物绿体基因组研究98-101
- 5.3 基于SMRT测序技术的灵芝子实体全长转录本分析101-103
- 第六章 展望103-105
- 参考文献105-119
- 附录119-136
- 后记136-138
- 作者简历138-139
【参考文献】
中国期刊全文数据库 前10条
1 邱德有,宋经元,马小军,祁建军,张荫麟;丹参毛状根生物反应器大规模培养的研究[J];分子植物育种;2004年05期
2 罗q;陈士林;陈科力;宋经元;姚辉;马新业;朱英杰;庞晓慧;余华;李西文;刘震;;基于芸香科的植物通用DNA条形码研究[J];中国科学:生命科学;2010年04期
3 戴玉成;杨祝良;;中国药用真菌名录及部分名称的修订[J];菌物学报;2008年06期
4 戴玉成;;中国多孔菌名录[J];菌物学报;2009年03期
5 刘文婷,梁宗锁,蒋传中,何蔚娟;丹参生殖生物学特性研究[J];现代中药研究与实践;2004年05期
6 李西文;高欢欢;王一涛;宋经元;Henry Robert;吴和珍;胡志刚;姚辉;罗红梅;罗q;潘宏林;陈士林;;荷花玉兰叶绿体全基因组高通量测序及结构解析[J];中国科学:生命科学;2012年12期
7 徐江;孙超;徐志超;季爱加;胡鸢雷;孙伟;王丽芝;汪波;杨培;张鑫;宋经元;陈士林;;药用模式生物研究策略[J];科学通报;2014年09期
8 燕安,俞利凤;叶绿体基因组:起源、结构与表达调控[J];生物学通报;2004年02期
9 于惠敏;解相林;;叶绿体的“内共生”与“基因转移”现象[J];生物学通报;2007年10期
10 施菲;张丽;陈士超;;应用SuperTRI方法重建百合目的系统发育关系[J];植物科学学报;2012年01期
中国博士学位论文全文数据库 前5条
1 李卿;灯盏细辛血管保护作用及南方红豆杉等叶绿体基因组研究[D];北京协和医学院;2011年
2 郭宝林;淫羊藿属植物的分子系统学研究[D];中国协和医科大学;1999年
3 李西文;川贝母保护生物学研究[D];中国协和医科大学;2009年
4 徐江;基于全基因组的灵芝药用模式真菌创建研究[D];北京协和医学院;2013年
5 钱俊;丹参的叶绿体和线粒体基因组研究[D];北京协和医学院;2014年
,本文编号:1101770
本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/1101770.html