四种瘿蜂科昆虫线粒体基因组测序分析及细蜂类系统发育研究
发布时间:2020-08-02 22:44
【摘要】:瘿蜂科隶属于膜翅目(Hymenoptera)瘿蜂总科(Cynipoidea),是该总科中唯一植食性常见农林类害虫。随着线粒体基因组序列在系统发育研究中的广泛应用,使得通过线粒体基因组探究物种在不同分类阶元的系统发育关系成为可能。截止目前为止,NCBI中已经积累了113种膜翅目昆虫全线粒体基因组,主要集中于茧蜂、蜜蜂、姬蜂和叶蜂等个体较大的蜂类。由于瘿蜂科昆虫个体非常小,大多数个体均小于3mm,体长范围位于1-10mm,因此瘿蜂总科仅有1种枝跗瘿蜂Ibalia leucospoides(NCBI登录号:KJ814197)获取了全线粒体基因组。瘿蜂科所属细蜂类内部系统发育关系不明确,瘿蜂科的进化地位也存在争议。本研究采用二代测序Illumina Hi Seq平台,对膜翅目瘿蜂总科瘿蜂科纹瘿蜂属黄纹瘿蜂Andricus flavus和Andricus sp.nov.、客瘿蜂属Synergus castaneus和栗瘿蜂属Dryocosmus kuriphilus四种瘿蜂昆虫线粒体进行了线粒体基因组序列测定,并进行了组装、注释和分析。利用比较基因组学与生物信息学结合的方法分析瘿蜂科线粒体基因组的特征,对瘿蜂科线粒体基因排列顺序与祖先昆虫进行了对比和说明。计算Ka、Ks、Ka/Ks比较瘿蜂科昆虫基因在进化中是否受选择压力。通过下载NCBI数据库中已收录的膜翅目细腰亚目细蜂类12种昆虫的线粒体基因组,基于线粒体13个蛋白质编码基因数据集,采用最大似然法(Maximum Likelihood)和贝叶斯算法(Bayesian)对细蜂类构建系统发育关系,对系统树结果进行合理分析。主要研究结果如下:1、通过高通量测序技术测得Andricus flavus、Andricus sp.nov.、Synergus castaneus和Dryocosmus kuriphilus的线粒体基因组。黄纹瘿蜂共获得11个蛋白质编码基因,2个r RNA基因,12个t RNA基因;Andricus sp.nov.共获得12个蛋白质编码基因,2个r RNA基因,10个t RNA基因;Synergus castaneus共获得13个蛋白质编码基因,2个r RNA基因,21个t RNA基因;Dryocosmus kuriphilus共获得12个蛋白质编码基因,1个r RNA基因,16个t RNA基因。2、Andricus flavus、Andricus sp.nov.、Synergus castaneus和Dryocosmus kuriphilus基因组在碱基组成上均具有AT偏向性,A+T含量远高于G+C含量,通过计算AT和CG偏斜值发现,不同类型基因中碱基使用偏好性不同。此外,第三位密码子处A+T含量高于其他两个位点。所有蛋白质编码基因起始密码子均为ATN,包括ATA、ATT、ATC、ATG,ATT使用频率最高,以TAA或不完整的TA或T为终止密码子。大多数t RNA二级结构呈现典型的三叶草型,存在多处常见的G-U错配。使用次数最多的密码子为UUA(Leu1),密码子第三位为A或U的密码子相对同义密码子RSCU值均大于1。3、瘿蜂科线粒体基因排列顺序与祖先昆虫的排列顺序不同,多个基因发生了位置变化和方向变化,存在基因重排现象。4、通过计算四种瘿蜂蛋白质编码基因的Ka、Ks、Ka/Ks值,发现瘿蜂科昆虫在进化中受到纯化作用。5、采用12种细蜂类昆虫和本实验测得的四种瘿蜂昆虫线粒体基因的13个蛋白质编码基因核苷酸序列为数据集,用最大似然法和贝叶斯法分别构建系统发育树,综合分析可知:细蜂类在总科水平分类关系不明确,科内分类关系稳定。
【学位授予单位】:浙江农林大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:S433
【图文】:
图 3.1 黄纹瘿蜂相对同义密码子使用频率(RSCU)Figure 3.1 The relative synonymous codon usage of Andricus flavus3.1.1.4 tRNA 基因本研究测得 Andricusflavus 线粒体基因组中 12 个 tRNA 基因,长度介于 59-71bp之间(表 3.2),通过 Mitos 获取比对成功的 tRNA 进行 tRNA 二级结构预测,12 个tRNA 基因的二级结构均为典型的三叶草结构,均包含四条恒定的臂:氨基酸臂、反密码子臂、双氢脲嘧啶臂和 TΨC 臂。图 3.2 为 12 个 tRNA 基因的二级结构图。基因间配对通常都遵循碱基互补配对原则,通过形成稳定的氢键从而维持二级结构的稳定。但也有少数部位发生了碱基错配,错配形式主要是 G-U 配对,共 4 处,由 5’端开始计数,分别出现的在 trnA 第 2 位、trnP 第 13 位、trnV 第 10 位和 trnY 第 10 位。trnRTΨC 环缺失。trnC 和 trnR 的氨基酸接受臂出现了变异,碱基未配对而形成环状结构。
20图 3.2 Andricus flavus tRNA 二级结构图Figure3.2 tRNA secondary strcture of Andricus flavus3.1.1.5 rRNA 基因黄纹瘿蜂包含 2 个 rRNA 基因 rrnL 和 rrnS,位于 trnR 和 trnC 之间,长度分别为1358bp 和 726bp,均由 N 链进行编码。trnR 与 rrnL 间存在 738bp 的基因间隔,rrnS和 trnC 存在 6bp 的基因重叠。3.1.2 Andricus sp. nov. 线粒体基因组基本特征3.1.2.1 线粒体基因组结构Andricus sp. nov.线粒体基因组包括有 12 个蛋白编码基因(atp6、atp8、nad2-6、nad4L、cox1-3、cob),nad1 基因缺失,2 个 rRNA 基因(rrnL 和 rrnS),以及 10 个tRNA 基因。其中 15 个基因由 J 链进行编码,包括 9 个蛋白质编码基因(cox1、cox2、
基因全部由 J 链进行编码。12 个蛋白质编码基因都以 ATN 为起始密码子,共有 5 个基因以 ATT 为起始密码子,分别为:nad2、cox2、nad4L、nad5;以 ATC 为起始密码子的仅 atp8 基因;有 2 个基因以 ATG 作为起始密码子,分别为:atp6、cob;而 cox1、nad3、nad6 这 3 个则以 ATA 作为起始密码子。对于终止密码子的使用,除 nad4L 以TAG 结尾,cox3 以不完整的 TA 结尾外,剩余的 10 个蛋白编码基因都以 TAA 结尾。利用软件统计 12 个蛋白质编码基因(去掉终止密码子后)的密码子使用情况,Andricus sp. nov.共使用 3234 个密码子,其中 UUA(Leu1)使用频率最高,共 490 次,其次是 AUU(Ile)、UUU(Phe)、AUA(Met),使用次数分别为 342、290 和 289。Andricus sp. nov.相对同义密码子使用频率(RSCU)见图 3.3,在所有密码子中,UUA的使用频率最高,AGC 而的使用频率最低。在 21 个氨基酸中,同时对应两个氨基酸的有丝氨酸(Ser)和亮氨酸(Leu),分别对应 trnS1、trnS2 和 trnL1、trnL2,对应的编码氨基酸的密码子中使用频率最高的分别是 UCU、AGA、UUA 和 CUA。所有氨基酸中占比最高的为 Ser1。
本文编号:2779171
【学位授予单位】:浙江农林大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:S433
【图文】:
图 3.1 黄纹瘿蜂相对同义密码子使用频率(RSCU)Figure 3.1 The relative synonymous codon usage of Andricus flavus3.1.1.4 tRNA 基因本研究测得 Andricusflavus 线粒体基因组中 12 个 tRNA 基因,长度介于 59-71bp之间(表 3.2),通过 Mitos 获取比对成功的 tRNA 进行 tRNA 二级结构预测,12 个tRNA 基因的二级结构均为典型的三叶草结构,均包含四条恒定的臂:氨基酸臂、反密码子臂、双氢脲嘧啶臂和 TΨC 臂。图 3.2 为 12 个 tRNA 基因的二级结构图。基因间配对通常都遵循碱基互补配对原则,通过形成稳定的氢键从而维持二级结构的稳定。但也有少数部位发生了碱基错配,错配形式主要是 G-U 配对,共 4 处,由 5’端开始计数,分别出现的在 trnA 第 2 位、trnP 第 13 位、trnV 第 10 位和 trnY 第 10 位。trnRTΨC 环缺失。trnC 和 trnR 的氨基酸接受臂出现了变异,碱基未配对而形成环状结构。
20图 3.2 Andricus flavus tRNA 二级结构图Figure3.2 tRNA secondary strcture of Andricus flavus3.1.1.5 rRNA 基因黄纹瘿蜂包含 2 个 rRNA 基因 rrnL 和 rrnS,位于 trnR 和 trnC 之间,长度分别为1358bp 和 726bp,均由 N 链进行编码。trnR 与 rrnL 间存在 738bp 的基因间隔,rrnS和 trnC 存在 6bp 的基因重叠。3.1.2 Andricus sp. nov. 线粒体基因组基本特征3.1.2.1 线粒体基因组结构Andricus sp. nov.线粒体基因组包括有 12 个蛋白编码基因(atp6、atp8、nad2-6、nad4L、cox1-3、cob),nad1 基因缺失,2 个 rRNA 基因(rrnL 和 rrnS),以及 10 个tRNA 基因。其中 15 个基因由 J 链进行编码,包括 9 个蛋白质编码基因(cox1、cox2、
基因全部由 J 链进行编码。12 个蛋白质编码基因都以 ATN 为起始密码子,共有 5 个基因以 ATT 为起始密码子,分别为:nad2、cox2、nad4L、nad5;以 ATC 为起始密码子的仅 atp8 基因;有 2 个基因以 ATG 作为起始密码子,分别为:atp6、cob;而 cox1、nad3、nad6 这 3 个则以 ATA 作为起始密码子。对于终止密码子的使用,除 nad4L 以TAG 结尾,cox3 以不完整的 TA 结尾外,剩余的 10 个蛋白编码基因都以 TAA 结尾。利用软件统计 12 个蛋白质编码基因(去掉终止密码子后)的密码子使用情况,Andricus sp. nov.共使用 3234 个密码子,其中 UUA(Leu1)使用频率最高,共 490 次,其次是 AUU(Ile)、UUU(Phe)、AUA(Met),使用次数分别为 342、290 和 289。Andricus sp. nov.相对同义密码子使用频率(RSCU)见图 3.3,在所有密码子中,UUA的使用频率最高,AGC 而的使用频率最低。在 21 个氨基酸中,同时对应两个氨基酸的有丝氨酸(Ser)和亮氨酸(Leu),分别对应 trnS1、trnS2 和 trnL1、trnL2,对应的编码氨基酸的密码子中使用频率最高的分别是 UCU、AGA、UUA 和 CUA。所有氨基酸中占比最高的为 Ser1。
【参考文献】
相关期刊论文 前4条
1 郭瑞;王义平;吴鸿;;虫瘿多样性及其与寄主植物和环境间关系[J];环境昆虫学报;2012年03期
2 申欣;田美;朱长保;刘会莲;赵方庆;;应用新一代测序技术测定大室别藻苔虫线粒体基因组全序列[J];海洋学报(中文版);2012年02期
3 江世宏;孟子烨;陈晓琴;李广京;;核糖体DNA序列分析在昆虫系统学研究中的应用[J];昆虫分类学报;2008年03期
4 徐庆刚,花保祯;线粒体DNA在昆虫系统学研究中的应用[J];西北农林科技大学学报(自然科学版);2001年S1期
相关博士学位论文 前1条
1 邱忠营;直翅目昆虫线粒体基因组比较、谱系及进化研究[D];陕西师范大学;2016年
相关硕士学位论文 前2条
1 华亚琼;中国按蚊属分类研究及两种按蚊的线粒体基因组测序分析[D];重庆师范大学;2016年
2 郭瑞;中国瘿蜂科昆虫系统分类研究[D];浙江农林大学;2012年
本文编号:2779171
本文链接:https://www.wllwen.com/kejilunwen/nykj/2779171.html