鱼类基因组中MITEs转座子的鉴定与演化分析
发布时间:2020-10-30 22:05
转座子(Transposable elements,TEs)是一类能够在基因组中移动的DNA重复序列,它主要分为两类,一类是以“复制和粘贴”的方式进行转座的逆转录转座子(RNA转座子),另一类是以“剪切和粘贴”的方式进行转座的DNA转座子。微型反向重复转座元件(Miniature inverted-repeat transposable elements,MITEs)主要是指DNA转座子中不能自主进行转座的一类转座子,长度一般为50到800 bp,其序列两端有一段典型的末端反向重复序列(TIR)和靶位点重复序列(TSD)。MITEs在脊椎动物基因组中拷贝数很高,通常分布在基因附近。目前对于MITEs的含量、多样性、分布和转座机制都有较为深入的认识。鱼类的物种数(大于30,000种)占整个脊椎动物物种数一半以上,它也是海洋和淡水生态系统重要组成部分,主要包含无颌类、软骨鱼类、肉鳍鱼类和辐鳍鱼类。在鱼类演化历史中,基因复制非常频繁,复制的基因和基因组对物种进化和形成都产生影响。随着下一代测序技术的发展,鱼类基因组数据被陆续公布,为我们研究的开展提供了契机。转座子在鱼类基因组的含量很高,比如斑马鱼(Danio rerio)基因组中58%都是转座子,所以转座子是鱼类基因组的重要组成部分。MITEs是转座子中特殊的一类,目前,植物、昆虫、病毒都构建了相关的MITEs转座子库,但对鱼类的MITEs转座子还没有一个较为系统的预测。因此完成鱼类代表物种基因组MITEs转座子的准确注释和相关基因分析,将有助于对鱼类的深入研究。本研究中我们选取了34种具代表性的鱼类(无颌类3种、软骨鱼类2种、肉鳍鱼类1种、辐鳍鱼类28种)和文昌鱼(Branchiostoma belcheri)的基因组,运用生物信息学方法对这些物种基因组中的MITEs进行鉴定和比较基因组学分析,主要研究结果如下:(1)鱼类基因组中MITEs的鉴定、分类和含量我们从NCBI中下载了全基因组数据,通过MITE-Hunter等软件预测鱼类基因组中的MITEs转座子并构建一致序列,然后通过TIR、TSD的序列特征对预测得到的MITEs转座子进行分类。结果表明,鱼类基因组中主要含有的MITEs超家族有:Tc1-Mariner、PHIS、P、Kobolok、PiggyBac、hAT、Ginger、CMC、Merlin、Sola2,其中Tc1-Mariner超家族占比最大。分析MITEs转座子含量与相应物种基因组大小的关系,发现两者并无相关性。(2)MITEs在基因组中的扩增模式根据K2P模型(Kimura 2 parameter distances)计算全长拷贝序列在基因组中的插入时间。发现在鱼类的演化过程中,出现了一到两次的MITEs转座子爆发事件,多数物种的转座子爆发发生在2-0.5百万年前,并且系统发育关系较近的物种,MITEs的扩增情况类似。无颌类的蒲氏盲鳗(Eptatretus burgeri)、日本七鳃鳗(Lethenteron camtschaticum)、海七鳃鳗(Petromyzon marinus)、软骨鱼类的猬鳐(Leucoraja erinacea)和肉鳍鱼类的矛尾鱼(Latimeria chalumnae),这五种鱼类的MITEs爆发都发生在1.5-0.5百万年前。辐鳍鱼类最近一次MITEs转座子爆发发生在2.5-1.5百万年前,墨西哥丽脂鲤(Astyanax mexicanus)、斑马鱼、罗非鱼(Oreochromis niloticus)、象鼻鱼(Paramormyrops kingsleyae)和犀角金线鲃(Sinocyclocheilus rhinocerous)出现了两次MITEs爆发期。由于MITEs需要借助其他转座子的转座酶进行转座,我们筛选了相应鱼类基因组中与MITEs具有一致TIR序列的长拷贝,最终在14种鱼类基因组中发现了72条自主型转座子,包含两个超家族:Tc1-Mariner和hAT,其中大部分自主型转座子是具有DD34E结构的Tc1-Mariner。(3)鱼类基因组中MITEs邻近基因分析选取的35个物种中,只有25种有注释信息文件可以进行MITEs插入位置和邻近基因分析。结果表明完整的MITEs在鱼类基因组中主要插入到基因的3'和5'端。同时,发现MITEs存在插入到基因内部的情况,并有多个拷贝插入到基因的外显子中。另外,不同鱼类基因组中的MITEs转座子会插入到相同基因,说明鱼类MITEs转座子的靶位点具有一定的相似性。根据各个物种在AnnotationHub中对应的注释信息数据库,将被MITEs插入的基因进行GO富集分析,由于MITEs很多插入到未注释的新基因中,因此只得到12个物种的GO富集结果。其中斑马鱼、斑点叉尾鮰(Ictalurus punctatus)、弗氏假鳃鳉(Nothobranchius furzeri)、大西洋鲑(Salmo salar)都富集到与GTP酶活性相关的多个term中,象鼻鱼(Paramormyrops kingsleyae)、日本青鳉(Oryzias latipes)富集到一个与ATP酶活性相关的term,墨西哥丽脂鲤和弗氏假鳃鳉都富集到基因在蛋白激酶活性的term中。综上所述,本研究对部分鱼类基因组的MITEs进行预测、构建一致序列、分类,进一步分析基因组大小和MITEs含量的关系。计算MITEs的插入时间来研究MITEs在鱼类基因组的扩增情况,确定MITEs的插入位置来探讨MITEs相关基因的功能。研究结果丰富了脊椎动物MITEs转座子数据,填补了鱼类MITEs转座子演化研究的空白,有助于促进鱼类基因组中MITEs的功能研究。
【学位单位】:西南大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:Q958.8
【部分图文】:
图 1.1 转座子的转座机制(Lisch, 2012)Figure 1.1 Transposition mechanism of TEs (Lisch, 2012)terminal repeat, LTR)、盘基网菌属的中等重复序列(Dictyostelium intermediaterepeatsequence,DIRS)、PLE 转座子(Penelope-likeelement,PLE)、长散在元件(Longinterspersed nuclear elements, LINE)和短散在元件(Short interspersed nuclearelements,SINE)(图 1.2)。其中 LTR 转座子两端具有长末端重复序列,LINE 两端没有长末端重复,但这两种逆转录转座子内部序列含有多种编码序列的酶,能够自主进行转座。而 SINE 无编码序列,需要依靠 LINE 提供的反转座酶进行转座(Kramerov & Vassetzky, 2011)。Class Ⅱ:DNA 转座子,它通过“剪切和粘贴(Cutandpaste) 的方式进行转座,具体过程是转座子先在供体位点被直接切除(Physically excise),然后在转座酶的作用下重新整合到靶位点,同时宿主会修复转座子切除引起的双链断裂,实现转座子的有效复制(Feschotte & Pritham, 2007; Lisch, 2012)(图 1.1)。它主要包含以下四个类型(图 1.2):TIR 型转座子(Terminal inverted repeat, TIR)、Helitron、
3图 1.2 转座子分类体系(Piegu et al., 2015)Figure 1.2 Classification system for transposable elements (TEs) (Piegu et al., 2015)置,颈环结构解开从而完成转座(Kapitonov & Jurka, 2007; Lisch, 2012)(图1.1)。对转座子的分类,最初基于 1989 年 Finnegan 提出的分类系统,他认为可以通过有无转座媒介将转座子分为两类:RNA 型(I 类或逆转录转座子)和 DNA 型(II类或 DNA 转座子)(Finnegan,1989)。这种分类方式被大家所认可,但这种粗略的分类不能满足越来越深入的转座子研究需要,2005 年时,Jurka 等人建立 Repbase
图 1.4 MITEs 的典型结构(Hu et al., 2018)Figure 1.4 Typical structure of MITEs (Hu et al., 2018),凭借 TIR 序列来定位 MITEs,它只能检测已知的 MITEs 序列(Santia002)。MAK 是基于转座子的特征序列进行预测,它通过确定已知的自主 TIR 序列和转座酶序列将 MITE 和自主转座子联系起来(Yang&Hall,200NSPO 和 MAK 两个软件则更适用于已知类别的 MITEs 鉴定,对未知的 M检测不到。MUST 最初的版本(Chen,2009),也是用结构性预测的方法,Es 有很高的敏感度,但是它和 FINDMITE 很像,会检测到有 TIR 和 TSDEs 的序列,其假阳性很高。后来开发团队使用 C++对它进行了优化,开Tv2,提高序列匹配阈值,降低了预测结果假阳性比例(Geetal.,2017)。Mer 能够直接对整个基因组数据进行处理,它的运行时间比 MUST 要短,自动生成转座子的一致序列,并分类到已知的家族;同时,MITE-Hunt
【参考文献】
本文编号:2863057
【学位单位】:西南大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:Q958.8
【部分图文】:
图 1.1 转座子的转座机制(Lisch, 2012)Figure 1.1 Transposition mechanism of TEs (Lisch, 2012)terminal repeat, LTR)、盘基网菌属的中等重复序列(Dictyostelium intermediaterepeatsequence,DIRS)、PLE 转座子(Penelope-likeelement,PLE)、长散在元件(Longinterspersed nuclear elements, LINE)和短散在元件(Short interspersed nuclearelements,SINE)(图 1.2)。其中 LTR 转座子两端具有长末端重复序列,LINE 两端没有长末端重复,但这两种逆转录转座子内部序列含有多种编码序列的酶,能够自主进行转座。而 SINE 无编码序列,需要依靠 LINE 提供的反转座酶进行转座(Kramerov & Vassetzky, 2011)。Class Ⅱ:DNA 转座子,它通过“剪切和粘贴(Cutandpaste) 的方式进行转座,具体过程是转座子先在供体位点被直接切除(Physically excise),然后在转座酶的作用下重新整合到靶位点,同时宿主会修复转座子切除引起的双链断裂,实现转座子的有效复制(Feschotte & Pritham, 2007; Lisch, 2012)(图 1.1)。它主要包含以下四个类型(图 1.2):TIR 型转座子(Terminal inverted repeat, TIR)、Helitron、
3图 1.2 转座子分类体系(Piegu et al., 2015)Figure 1.2 Classification system for transposable elements (TEs) (Piegu et al., 2015)置,颈环结构解开从而完成转座(Kapitonov & Jurka, 2007; Lisch, 2012)(图1.1)。对转座子的分类,最初基于 1989 年 Finnegan 提出的分类系统,他认为可以通过有无转座媒介将转座子分为两类:RNA 型(I 类或逆转录转座子)和 DNA 型(II类或 DNA 转座子)(Finnegan,1989)。这种分类方式被大家所认可,但这种粗略的分类不能满足越来越深入的转座子研究需要,2005 年时,Jurka 等人建立 Repbase
图 1.4 MITEs 的典型结构(Hu et al., 2018)Figure 1.4 Typical structure of MITEs (Hu et al., 2018),凭借 TIR 序列来定位 MITEs,它只能检测已知的 MITEs 序列(Santia002)。MAK 是基于转座子的特征序列进行预测,它通过确定已知的自主 TIR 序列和转座酶序列将 MITE 和自主转座子联系起来(Yang&Hall,200NSPO 和 MAK 两个软件则更适用于已知类别的 MITEs 鉴定,对未知的 M检测不到。MUST 最初的版本(Chen,2009),也是用结构性预测的方法,Es 有很高的敏感度,但是它和 FINDMITE 很像,会检测到有 TIR 和 TSDEs 的序列,其假阳性很高。后来开发团队使用 C++对它进行了优化,开Tv2,提高序列匹配阈值,降低了预测结果假阳性比例(Geetal.,2017)。Mer 能够直接对整个基因组数据进行处理,它的运行时间比 MUST 要短,自动生成转座子的一致序列,并分类到已知的家族;同时,MITE-Hunt
【参考文献】
相关期刊论文 前1条
1 许红恩;张化浩;韩民锦;沈以红;黄先智;向仲怀;张泽;;真核生物转座子鉴定和分类计算方法[J];遗传;2012年08期
本文编号:2863057
本文链接:https://www.wllwen.com/projectlw/swxlw/2863057.html
教材专著