当前位置:主页 > 理工论文 > 生物学论文 >

二级结构进化约束下的ITS2系统发育分析

发布时间:2020-10-17 18:48
   ITS是目前唯一一个在植物系统发育研究中广泛使用的核基因。ITS2是ITS主要的变异区,在近缘物种鉴定,特别是DNA条形码研究中具有更高的利用价值。一直以来,系统发育分析将ITS2基因片段作为DNA序列处理,然而ITS2在生物体内会转录成具有二级结构的rRNA分子,其配对区碱基存在特殊的“碱基补偿替换”现象,即配对碱基间的共进化。这与DNA模型中碱基变异的独立性假设存在冲突。然而这种不恰当的模型假设会对ITS2系统发育分析造成多大的影响至今尚无定论。本研究在大数据的基础上,基于RNA模型来评估ITS2在二级结构约束下的进化规律,并评估其对构建进化树的影响,为优化ITS2系统发育分析、获得更为准确的ITS2进化关系树提供借鉴。为全面评估RNA模型对ITS2序列的适合度并分析ITS2二级结构的进化规律,本研究中以属为基本单位,选取了种子植物32目,42科中的70个属,共计2203种、4219条ITS2序列,全面覆盖了种子植物的代表性支系。基因序列下载自GenBank并通过其基因注释信息结合ITS2 Database的Annotate功能界定ITS2。在常规系统发育分析中,选用贝叶斯方法构建基于DNA模型的系统发育树,使用MrModelTest获得最优进化模型,使用MrBayes软件构建贝叶斯树。在基于RNA进化模型的系统发育分析中,首先使用LocARNA软件来预测ITS2共有二级结构,并根据ITS2的保守结构进行人工校正;其次利用PHASE-3.0软件包中的model_selection.pl程序获得最优进化模型;最后使用PHASE-3.0软件包中的mcmcphase.exe程序构建贝叶斯树。对两种分析方法所构建的进化树比较树图拓扑结构、支持率和鉴定效率并进行统计学分析,进而评估使用RNA模型的优越性。研究结果表明:(1)70属ITS2配对区最优进化模型均是RNA模型,其中绝大多数类群是16-state RNA模型,少数是7-state RNA模型。此外,在模型选择结果中是否设置γ模型参数(表示为是否+G)以及7-state模型对错配碱基对(MM)的不同处理(等频率或经验频率)在结果中均有涉及,这些结果表明ITS2配对区的进化模式与DNA的进化模式不一致且存在RNA进化模式的多样性,显示了使用RNA模型研究ITS2系统发育的必要性。(2)配对区的G+C碱基频率总是高于非配对区。碱基对的频率从高至低依次是GC、UA、GU、MM,而碱基对替换速率与之相反,表明ITS2序列倾向于保留稳定的碱基配对(如GC)以维持二级结构。此外,对双替换(rd)、双颠换(rv)、正向速率(沃森-克里克配对转换为GU,rf)和反向速率(由GU转换为沃森-克里克配对,rb)这4个替换速率参数的统计结果显示有34属rd和rv参数值不为0,有19属rd/rv大于1,而其它15属则是rd/rv小于1;在所有情况下rd均小于rf在部分类群如菟丝子属(Cuscuta)中,rb/rf约等于1,但在大多数情况下rb大于rf,这表明真实植物类群中存在CBC且双替换一般通过两步法完成,中间态GU能相对稳定地存在,但会更加快速地转化为沃森-克里克配对。(3)对基于DNA模型和基于混合模型(配对区RNA模型,非配对区DNA模型)的系统发育树进行比较,基于混合模型的系统发育树的支持率在不同区间范围内(支持率大于50%、70%、90%、95%)有不同程度的降低。在支持率大于95%区间内,70属中有30属在加入RNA模型建树后鉴定效率下降,下降百分比最大100%。这表明由于RNA模型以共进化的碱基对作为进化单位,降低了信息位点数量,使得构建的贝叶斯树支持率和物种鉴定率都有不同程度的下降。因此,我们的结果进一步证实了传统使用DNA模型的方法可能会导致支持率和鉴定效率虚高的推测。(4)另一些结果表明使用RNA模型建树后少数类群的支持率和鉴定效率有增加的现象。这可能是由半补偿性突变的存在及共有二级结构指导下序列比对的结果中增加了同源信息位点引起的。基于大数据和新方法体系的研究结论,证明了传统上使用DNA模型对ITS2基因的分析方法需要优化。本文建议在将ITS2基因用于系统发育分析时,应当考虑ITS2二级结构对其进化的约束,将RNA模型加入分析。这为澄清更多进化事实、建立更精确的系统发育学方法提供了新视角。
【学位单位】:山东大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:Q943
【部分图文】:

序列,互补碱基,二级结构,落新妇


图1-1?ITS2二级结构及在配对区发生的互补碱基替换。A.落新妇的ITS2二级结构;B.落??新妇属两物种ITS2二级结构I号臂上的互补碱基替换,图左为落新妇,图右为溪畔落新妇。??Fig.?1-1?The?ITS2?secondary?structure?and?compensatory?base?pair?change?(CBC).?A.?ITS2??secondary?structure?of?Astilbe?chinensis;?B.?CBC?in?stem?I?of?ITS2?secondary?structure?of?two??Astilbe?species,?A.?chinensis?(left)?and?A.?rivularis?(right).??在系统发育分析方法中,序列矩阵的进化规律具体表现为进化模型的参数设??置。前人研究表明,RNA模型描述RNA二级结构配对区的序列进化时要优于??DNA模型。因此,基于二级结构信息进行结构分区并使用RNA进化模型分??析配对区序列可能更适合统计ITS2序列中发生的突变规律然而,目??前却鲜有研宄将RNA模型用于ITS2的系统发育分析中。??综上所述,在实际的系统发育分析中,忽略ITS2作为RNA以二级结构进??化的事实,将其作为DNA序列处理是否会对系统发育分析造成影响?如果RNA??模型更适用于ITS2二级结构的配对区序列,那么利用RNA模型分析ITS2序列??

框架图,框架图,二级结构,落新妇


BMM??图1-1?ITS2二级结构及在配对区发生的互补碱基替换。A.落新妇的ITS2二级结构;B.落??新妇属两物种ITS2二级结构I号臂上的互补碱基替换,图左为落新妇,图右为溪畔落新妇。??Fig.?1-1?The?ITS2?secondary?structure?and?compensatory?base?pair?change?(CBC).?A.?ITS2??secondary?structure?of?Astilbe?chinensis;?B.?CBC?in?stem?I?of?ITS2?secondary?structure?of?two??Astilbe?species,?A.?chinensis?(left)?and?A.?rivularis?(right).??在系统发育分析方法中,序列矩阵的进化规律具体表现为进化模型的参数设??置。前人研究表明,RNA模型描述RNA二级结构配对区的序列进化时要优于??DNA模型。因此,基于二级结构信息进行结构分区并使用RNA进化模型分??析配对区序列可能更适合统计ITS2序列中发生的突变规律然而,目??前却鲜有研宄将RNA模型用于ITS2的系统发育分析中。??综上所述,在实际的系统发育分析中,忽略ITS2作为RNA以二级结构进??化的事实

分布情况,裸子植物,类群,分布情况


植物不同进化支系中选取实验类群。裸子植物类群目前还没有基于分子数据建立??的分类系统,本研宄根据之前研宄者利用分子数据构建的系统发育树进行采样??[51_52]。理论上来说,增加取样密度可以避免长枝吸引等系统误差,进而提高系统??发育研宂的准确性[53_57]。然而部分属属内物种多且被测序的ITS2序列数量庞大,??会影响共有二级结构预测的准确性,因此我们只进行了有限的取样,在特殊情况??下取样密度只保证包含此类群的物种多样性和谱系多样性。??2.1.2实验材料??本研宄共选取了种子植物70个属作为研究对象。其中裸子植物9属,包括??177物种,389个体,隶属于2目6科(图2-1)。被子植物61属,包括2026??物种,3830个体,覆盖各大主要类群分支(图2-2),隶属于27目36科(附录??1)。本次取样序列均下载自GenBank,所用序列共4219条,研究对象及其采样??序列详细信息见附录2。???Cycadaceae??
【相似文献】

相关期刊论文 前10条

1 白凤兰;徐丽;;RNA二级结构的数学表示及其应用[J];大连交通大学学报;2010年06期

2 于正刚;赵熙强;;RNA二级结构的一种新的图形表示及其应用[J];中国海洋大学学报(自然科学版);2009年02期

3 史军伟;徐阳;徐玲玲;廖亮;;RNA二级结构分析方法及在植物系统学研究上的应用[J];九江学院学报;2008年03期

4 郭颖,李大超;一类RNA二级结构的计数[J];海南师范学院学报(自然科学版);2005年01期

5 贾孟文,罗辽复,刘次全;蛋白质的二级结构和mRNA的二级结构的相关性研究[J];内蒙古大学学报(自然科学版);2004年01期

6 任清华,莫忠息,陶玉敏;预测RNA二级结构的一种遗传模拟退火算法[J];武汉大学学报(理学版);2004年01期

7 廖波,王天明;RNA二级结构的最小自由能算法[J];生物数学学报;2003年03期

8 廖波,王天明;一类RNA二级结构的计数[J];应用数学;2002年02期

9 叶青;一种快速计算RNA分子二级结构的方法[J];生物化学杂志;1987年05期

10 罗辽复,董玉枝;肽键的统计分析和蛋白质的二级结构[J];生物化学杂志;1988年02期


相关博士学位论文 前10条

1 熊大鹏;基于深度学习架构的蛋白质远程残基接触预测研究[D];清华大学;2017年

2 毛圆辉;翻译过程中mRNA二级结构的功能研究[D];西北农林科技大学;2015年

3 初环宇;蛋白质设计和结构模拟若干问题研究[D];中国科学技术大学;2018年

4 宋海峰;基于系统发育比较分析的反义药物优化设计及相关药理学研究[D];中国人民解放军军事医学科学院;2004年

5 刘娜;生物序列/结构的比较及进化树的构建[D];大连理工大学;2007年

6 王燕;机器学习在蛋白质结构和功能预测中的应用研究[D];华中科技大学;2006年

7 陈鹏;蛋白质残基间的相互作用分析与预测[D];中国科学技术大学;2007年

8 高世乐;含假结RNA二级结构图的语法及拓扑分类[D];大连理工大学;2008年

9 付洁;靶向HBV的siRNA优化设计研究[D];中国人民解放军军事医学科学院;2008年

10 于学东;登革4型病毒基因组5’端SLB和cHP二级结构对复制和翻译的调控作用[D];中国人民解放军军事医学科学院;2008年


相关硕士学位论文 前10条

1 赵奉熙;二级结构进化约束下的ITS2系统发育分析[D];山东大学;2019年

2 孙睿;多糖对海参体壁胶原蛋白理化特性影响机制研究[D];大连工业大学;2017年

3 赵微;蛋白质8态二级结构以及抗癌肽预测的研究[D];内蒙古农业大学;2017年

4 李欢欢;丝纤维老化过程中一级和二级结构变化研究[D];北京服装学院;2012年

5 艾露露;RNA二级结构中假结的研究及预测[D];吉林大学;2015年

6 李倩;mRNA二级结构与基因功能和基因必要性的关系[D];西北农林科技大学;2013年

7 李杰;RNA二级结构表示及相似性分析研究[D];吉林大学;2011年

8 郭颖;RNA的二级结构[D];大连理工大学;2005年

9 杨红;RNA二级结构的计数[D];大连理工大学;2006年

10 马涛;mRNA二级结构对酿酒酵母翻译效率的影响[D];西北农林科技大学;2015年



本文编号:2845183

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2845183.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c470f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com