基于白及转录组数据的EST-SSR分子标记开发、验证及应用
发布时间:2020-07-18 05:07
【摘要】:目的:构建白及转录组Unigenes数据库,为白及及其近缘物种的功能基因、代谢组、蛋白组及分子标记开发等研究提供坚实的资源基础。并通过已构建Unigenes文库进行白及EST-SSR分子标记的开发、验证和应用,为白及遗传多样性分析、种质资源鉴定及分子辅助育种等方面的研究奠定一定实验和理论基础。方法:首先,在已获得白及全生长时期的全组织器官转录组数据基础上,利用Trinity进行De Novo组装,并将所得全部Unigenes进行功能注释分析;随后再利用MISA及Primer 3.0在线程序分别进行EST-SSRs位点扫描和相关引物设计(每个位点设计三对引物);并在完成白及基因组DNA提取方法及其EST-SSR-PCR体系的优化后,从中随机选取100对引物(每位点随机选取1对引物)在四份白及材料中进行种内扩增验证,并针对其中的多态性标记进一步利用两个近缘属的6份材料进行种间通用性检测;最后,选取扩增验证结果中稳定且扩增条带在预期范围内的引物对已收集的23份白及种质进行遗传多样性的评价分析。结果:1.白及Unigenes数据库构建及其功能注释分析已得白及原始转录组序列经过滤处理后共得到106,054,784条Clean reads。随后,将所得Clean reads上传至NCBI数据库(SRA:SRR7058048),并利用Trinity软件进一步组装构建得到首个包含127,261条Unigenes的白及核苷酸数据库(TSA:SUB427309),平均Unigenes长612 bp。进一步功能注解表明,共成功注释Unigene 67,494条,注释率为53.04%。2.白及EST-SSR位点挖掘及其引物标记开发利用MISA在线软件共从15,433条unigenes中检索得到EST-SSRs位点18,335个(去除复合型位点778个),平均每4.35 kb分布有一个EST-SSR位点。统计发现,本研究中白及EST-SSRs以单核苷酸重复最为丰富(9,128 49.78%),其次为二核苷酸重复(4,884 26.64%)和三核苷酸重复(4,166 22.72%)。在各重复类型分布特征统计中发现,出现频率较高的核苷酸类型分别为单核苷酸A/T(8,996 98.55%),二核苷酸AG/CT(3,286 17.92%),其次为三核苷酸中的AAG/CTT(1,020 5.56%)。最后,以检索出的18,335个EST-SSRs位点序列为基础,利用Primer 3.0成功设计引物25,935对。3.白及EST-SSR标记的可用性及种间通用性检测100对随机引物的可用性验证结果显示,共87对能够成功扩增,其中63对的扩增条带符合预期长度(100~300 bp),25对引物在所试材料中具有明显多态性。种间通用性扩增结果表明,其中2对标记(ZYBS-1,ZYBS-52)在蝴蝶兰属和石斛属中均能成功扩增,而ZYBS-14只能在蝴蝶兰属中扩增,ZYBS-18和ZYBS-60则只能在石斛属材料中扩增。4.白及基因组DNA提取方法优化基于以往基因组DNA提取方法的相关研究,首先选择常用的CTAB法进行白及基因组DNA提取方法的优化分析。通过与TIANGEN植物基因组DNA提取试剂盒、ZOMANBIO植物基因组DNA提取试剂盒和SDS法三种方法所提基因组DNA的UV光谱及琼脂糖凝胶电泳(AGE)检测结果比较得知,改良CTAB法相比其他方法提取的DNA质量和产率均较高(A260/A280=1.82,A260/A230=2.09,C_(产率)(μg/g)=160.68μg/g)。同时,EST-SSR的扩增结果亦证明改良CTAB法提取的DNA完全满足EST-SSR标记相关的扩增研究。此外,ITS2序列扩增结果表明,改良CTAB法提取的基因组DNA能够很好扩增,但在SDS法提取的DNA中不能有效扩增。5.白及EST-SSR-PCR优化体系的构建通过响应面设计法对白及EST-SSR-PCR 10μL扩增体系的三个关键因素(模板DNA浓度、引物浓度和2×PCR mix用量)在三水平上进行配比寻优,最终得出10μL白及EST-SSR-PCR体系中模板DNA浓度、引物浓度和2×PCR mix用量的最优配比为:1.60 ng.μL~(-1):2μM:6.98μL。验证结果表明,该优化比在10μL和25μL两种验证体系中均能扩增出稳定且背景清晰的条带,说明本研究得到的优化组合较为稳定,且完全满足白及后续基于EST-SSR的相关研究。6.所开发EST-SSR标记在白及遗传多样性研究中的应用依据引物可用性验证结果共选取52对标记,以23份供试白及为模板进行扩增,6%非变性PAGE凝胶电泳分离结果显示,其中25对具有明显多态性,共扩增位点108个,多态性位点91个,等位变异范围1-8个。GS聚类分析结果与主坐标聚类分析结果有着高度一致性,均能将23份材料归至三个亚群(第一类群包含编号为1、2、3、4、5、6、7的七份栽培白及,第二类群包括编号为8、9、10、11、12、13、14、15的8份贵州正安县野生白及,第三类群包含编号为16、17、18、19、20、21、22、23的8份贵州修文县野生白及)。结论:本研究利用不同生长时期的白及材料通过高通量转录本测序技术成功构建起了第一个白及转录组Unigenes数据库,并开发了EST-SSR候选引物标记25,935对,不仅为白及后续功能基因组学、代谢组学、蛋白组学及分子标记开发和利用等研究奠定了坚实的资源基础,亦为其近缘物种的相关研究提供了重要参考和新思路。同时,通过所开发标记在23份白及材料遗传多样性研究中的应用,更为后续基于EST-SSR分子标记的白及相关研究奠定了坚实的实验基础。
【学位授予单位】:遵义医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:S567.239
【图文】:
Raw reads Total raw reads 109,714,290Clean reads 总 clean reads 数 106,054,784总 clean 核苷酸数 (nt) 13.26 GQ20 (%) 95.69%Q30 (%) 91.49%GC 含量 (%) 47.87%Unigenes 总 Unigene 条数 127,261总序列长度 (Kb) 79,698最长 Unigene 长度(bp) 21,950最短 Unigene 长度(bp) 201平均 Unigenes 长度 (bp) 612N50 (bp) 957N90 (bp) 249成功注释的 Unigenes 数(条) 67,494进一步统计发现(图 1),随着 unigenes 长度的增加其数量具有明显下降的趋势,其中200-500 bp的Unigene占68.03%(88,532),1001-2000 bp包含Unigene13,459 条,而长度达 2000 bp 以上仅 6,751 条(5.19%)。
355 38.78NT 34,751 27.31KO 20,764 16.32Swiss-Prot 40,109 31.52PFAM 40,920 32.15GO 41,818 32.86KOG 24,615 19.34成功注释的 Unigene 总数 67,494 53.04合计 127,261 100.00其中,GO 注释通过国际化标准生物学模型 Blast 2 GO 程序完成,共涉及生物学过程、细胞组分及分子功能三大范畴(图 2)。由图 2 可知,细胞组分范畴以 cell(13,310,31.83%)、cell part(13,302,31.81%)为主,生物学过程以 cellularprocess(23,257,55.61%)、metabolic process(23,124,55.30%)和 single-organismprocess(17,570,42.02%)三簇的 unigenes 最多,而分子功能范畴则以 binding(21,760,52.04%)、catalytic activity (19,082,45.63%)为最。
遵义医科大学硕士学位论文 陈红波KOG 注释显示,共 24,615(19.34%)条 unigene 成功归入 26 个 Ortholog 簇(图 3)。其中以 R(General function prediction only)、O(Posttranslational modification,protein turnover, chaperones)、J(Translation, ribosomal structure and biogenesis)三簇 Unigene 最多,分别有 3,889(15.80%)、3,240(13.16%)、2,931(11.91%)条。
【学位授予单位】:遵义医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:S567.239
【图文】:
Raw reads Total raw reads 109,714,290Clean reads 总 clean reads 数 106,054,784总 clean 核苷酸数 (nt) 13.26 GQ20 (%) 95.69%Q30 (%) 91.49%GC 含量 (%) 47.87%Unigenes 总 Unigene 条数 127,261总序列长度 (Kb) 79,698最长 Unigene 长度(bp) 21,950最短 Unigene 长度(bp) 201平均 Unigenes 长度 (bp) 612N50 (bp) 957N90 (bp) 249成功注释的 Unigenes 数(条) 67,494进一步统计发现(图 1),随着 unigenes 长度的增加其数量具有明显下降的趋势,其中200-500 bp的Unigene占68.03%(88,532),1001-2000 bp包含Unigene13,459 条,而长度达 2000 bp 以上仅 6,751 条(5.19%)。
355 38.78NT 34,751 27.31KO 20,764 16.32Swiss-Prot 40,109 31.52PFAM 40,920 32.15GO 41,818 32.86KOG 24,615 19.34成功注释的 Unigene 总数 67,494 53.04合计 127,261 100.00其中,GO 注释通过国际化标准生物学模型 Blast 2 GO 程序完成,共涉及生物学过程、细胞组分及分子功能三大范畴(图 2)。由图 2 可知,细胞组分范畴以 cell(13,310,31.83%)、cell part(13,302,31.81%)为主,生物学过程以 cellularprocess(23,257,55.61%)、metabolic process(23,124,55.30%)和 single-organismprocess(17,570,42.02%)三簇的 unigenes 最多,而分子功能范畴则以 binding(21,760,52.04%)、catalytic activity (19,082,45.63%)为最。
遵义医科大学硕士学位论文 陈红波KOG 注释显示,共 24,615(19.34%)条 unigene 成功归入 26 个 Ortholog 簇(图 3)。其中以 R(General function prediction only)、O(Posttranslational modification,protein turnover, chaperones)、J(Translation, ribosomal structure and biogenesis)三簇 Unigene 最多,分别有 3,889(15.80%)、3,240(13.16%)、2,931(11.91%)条。
【相似文献】
相关期刊论文 前9条
1 张光望;游杨;罗延延;张明菊;李志良;王书珍;;生菜EST-SSR的分布特征分析(英文)[J];Agricultural Science & Technology;2016年12期
2 林富荣;邢俊连;孟艳琼;黄平;郑勇奇;;皂荚EST-SSR分子标记开发与分析评价[J];植物遗传资源学报;2017年01期
3 张恩亮;王鹏;李亚;王淑安;李林芳;杨如同;;紫薇EST-SSR标记的开发与利用[J];北方园艺;2016年22期
4 陈勋;龚自明;;基于EST-SSR标记的湖北茶树种质资源遗传多样性分析[J];分子植物育种;2017年05期
5 胡仲义;付涛;何月秋;李文;林立;;铁皮石斛EST-SSR引物的评价、甄选与应用研究[J];植物研究;2017年01期
6 林珲;朱海生;陈敏氡;王彬;温庆放;吴卫东;;花椰菜EST-SSR反应体系的优化[J];分子植物育种;2015年11期
7 贾新平;邓衍明;孙晓波;梁丽建;;鸟巢蕨EST-SSR标记的开发与应用[J];华北农学报;2015年06期
8 王忠良;丁q
本文编号:2760459
本文链接:https://www.wllwen.com/nykjlw/nzwlw/2760459.html
最近更新
教材专著