线虫核糖核蛋白基因外显子连接序列与其内含子的相互作用
发布时间:2021-09-04 22:57
剪接后的内含子与相应mRNA序列之间存在序列匹配关系,它们参与基因的表达和调控过程。为了揭示两者之间的序列匹配特征,对线虫核糖核蛋白基因的外显子连接序列与相应内含子序列采用Smith-Waterman局域比方法得到它们的最佳匹配片段,分析了外显子连接序列上的匹配频率F值分布。发现:1)连接点两侧匹配频率分布有明显的差异,显示出了外显子的边界。2)第一内含子和长内含子在外显子连接序列上的分布偏好与其他内含子有明显区别。3)对第一内含子而言,高GC含量的最佳匹配片段在外显子连接序列上表现出明显的偏置,在外显子上游EJC结合区域的匹配频率出现极小值分布。结果表明:EJC和内含子在与外显子序列结合的过程中存在相互竞争和相互协作的关系,内含子序列与编码序列是协同进化的,通过相互作用完成应有的功能。
【文章来源】:内蒙古大学学报(自然科学版). 2020,51(06)北大核心
【文章页数】:7 页
【部分图文】:
匹配频率F值在外显子连接序列上的分布。横坐标为外显子连接序列在-50bp-50bp的位置,0点为外显子与外显子连接点,纵坐标为匹配频率F值。
从物理意义上来讲,真核基因中断裂基因片段(外显子与外显子)结合处的信息特征是非常重要的。前期的研究发现,长内含子分别与整个编码序列和外显子序列的比对结果指出,长内含子后部序列与外显子-外显子结合序列紧密相关,而前部序列与外显子内部序列紧密相关。此结论还得出了长内含子存在的一个理由,因为只有长内含子才能够将内含子不同的功能置放在其不同的物理区域,以便各个功能能够顺利表达[33]。已知基因中不同长度的内含子会对基因的表达产生影响[32]由于内含子长度的差异,根据Halligan研究结论,以80bp为界将内含子分为长内含子和短内含子两类。以长、短两类内含子分别与相应外显子连接序列比对,发现,它们共同的特征是在外显子连接点两侧,匹配频率分布有明显的差别,连接点上游出现F的峰值明显高于其下游(见图2A、2B)。长内含子与外显子连接序列的匹配频率分布中在EJC区域的匹配频率低,或EJC位置明显(见图2A),而短内含子的分布中EJC的位置并不明显(见图2B)。这表明长内含子与外显子连接序列结合时有意避开EJC区域,短内含子的这种作用趋势较弱。另外,对于长第一内含子的最佳匹配片段的匹配频率在外显子连接处上游约20bp处出现更加明显的极小值,这正是实验证实的EJC结合位置(见图2C),然而短第一内含子在EJC区域的频率分布无太大变化(见图2D)。可见长、短两类内含子对EJC的结合是有差异的。我们认为,长内含子和第一内含子是与EJC位置协作的主体,短内含子和其他内含子是与EJC位置竞争的主体。2.3 内含子中最佳匹配片段的G+C含量对EJC位置的影响
G+C含量是分析生物基因序列有效的参数。探讨不同G+C含量的最佳匹配片段在外显子序列上的分布情况,若最佳匹配片段的G+C含量大于0.5,称为高GC片段,最佳匹配片段的G+C含量小于0.3,称为低GC片段。分别得到这两类最佳匹配片段在外显子连接序列上的匹配频率分布(见图3A和3B),发现它们在外显子连接处两侧F值都有差异,但对于高GC片段的F值在连接点上游出现极大值(F≈0.38)并且在EJC区域有明显的极小值(F≈0.15)分布(见图3A)。低GC片段的匹配频率分布上有多个极小值,极大值和极小值间的差值较小(见图3B)。由3.1节结果分析表明,第一内含子具有潜在的重要功能。因此在局域比对分析中取出线虫基因中第一内含子的序列,将它们与相应的第一外显子和第二外显子构成的连接序列进行局域比对。然后再把得到的最佳匹配片段按G+C含量进行分组:第一内含子低GC片段和第一内含子高GC片段。分别给出它们在外显子连接序列上F值分布。发现,基于第一内含子中高GC含量的最佳匹配片段得到的F值分布的极大值约为0.4,该值高于第一内含子所对应的F值分布的极大值(F≈0.33)(见图1B),在外显子连接序列上游25bp有极小值约为0.1(见图3C)。基于第一内含子中低GC含量的最佳匹配片段得到的F值分布,在EJC区域也显示出分布的极小值(见图3D),但极大值F约为0.3,该值小于第一内含子中高GC含量的最佳匹配片段得到的极大值F(见图3C)。上述结果表明,内含子与相应外显子连接序列的相互作用对外显子的边界是敏感的。第一内含子中高GC含量匹配片段在EJC区域出现更加明显的极小值,而低GC片段在多个区域显示出这一特征。3 讨论
【参考文献】:
期刊论文
[1]果蝇成熟mRNA序列与其相应内含子序列的匹配特征分析[J]. 薄素玲,李宏,张强,杨振华,包通嘎拉,应智强,赵小庆. 内蒙古大学学报(自然科学版). 2018(06)
[2]基因外显子连接序列与相应内含子序列的相互作用[J]. 张强,李宏,赵小庆,许士华. 生物信息学. 2013(03)
[3]线虫核糖核蛋白基因内含子与相应编码序列的相互作用[J]. 赵小庆,李宏,包通拉嘎. 生物化学与生物物理进展. 2010(09)
本文编号:3384161
【文章来源】:内蒙古大学学报(自然科学版). 2020,51(06)北大核心
【文章页数】:7 页
【部分图文】:
匹配频率F值在外显子连接序列上的分布。横坐标为外显子连接序列在-50bp-50bp的位置,0点为外显子与外显子连接点,纵坐标为匹配频率F值。
从物理意义上来讲,真核基因中断裂基因片段(外显子与外显子)结合处的信息特征是非常重要的。前期的研究发现,长内含子分别与整个编码序列和外显子序列的比对结果指出,长内含子后部序列与外显子-外显子结合序列紧密相关,而前部序列与外显子内部序列紧密相关。此结论还得出了长内含子存在的一个理由,因为只有长内含子才能够将内含子不同的功能置放在其不同的物理区域,以便各个功能能够顺利表达[33]。已知基因中不同长度的内含子会对基因的表达产生影响[32]由于内含子长度的差异,根据Halligan研究结论,以80bp为界将内含子分为长内含子和短内含子两类。以长、短两类内含子分别与相应外显子连接序列比对,发现,它们共同的特征是在外显子连接点两侧,匹配频率分布有明显的差别,连接点上游出现F的峰值明显高于其下游(见图2A、2B)。长内含子与外显子连接序列的匹配频率分布中在EJC区域的匹配频率低,或EJC位置明显(见图2A),而短内含子的分布中EJC的位置并不明显(见图2B)。这表明长内含子与外显子连接序列结合时有意避开EJC区域,短内含子的这种作用趋势较弱。另外,对于长第一内含子的最佳匹配片段的匹配频率在外显子连接处上游约20bp处出现更加明显的极小值,这正是实验证实的EJC结合位置(见图2C),然而短第一内含子在EJC区域的频率分布无太大变化(见图2D)。可见长、短两类内含子对EJC的结合是有差异的。我们认为,长内含子和第一内含子是与EJC位置协作的主体,短内含子和其他内含子是与EJC位置竞争的主体。2.3 内含子中最佳匹配片段的G+C含量对EJC位置的影响
G+C含量是分析生物基因序列有效的参数。探讨不同G+C含量的最佳匹配片段在外显子序列上的分布情况,若最佳匹配片段的G+C含量大于0.5,称为高GC片段,最佳匹配片段的G+C含量小于0.3,称为低GC片段。分别得到这两类最佳匹配片段在外显子连接序列上的匹配频率分布(见图3A和3B),发现它们在外显子连接处两侧F值都有差异,但对于高GC片段的F值在连接点上游出现极大值(F≈0.38)并且在EJC区域有明显的极小值(F≈0.15)分布(见图3A)。低GC片段的匹配频率分布上有多个极小值,极大值和极小值间的差值较小(见图3B)。由3.1节结果分析表明,第一内含子具有潜在的重要功能。因此在局域比对分析中取出线虫基因中第一内含子的序列,将它们与相应的第一外显子和第二外显子构成的连接序列进行局域比对。然后再把得到的最佳匹配片段按G+C含量进行分组:第一内含子低GC片段和第一内含子高GC片段。分别给出它们在外显子连接序列上F值分布。发现,基于第一内含子中高GC含量的最佳匹配片段得到的F值分布的极大值约为0.4,该值高于第一内含子所对应的F值分布的极大值(F≈0.33)(见图1B),在外显子连接序列上游25bp有极小值约为0.1(见图3C)。基于第一内含子中低GC含量的最佳匹配片段得到的F值分布,在EJC区域也显示出分布的极小值(见图3D),但极大值F约为0.3,该值小于第一内含子中高GC含量的最佳匹配片段得到的极大值F(见图3C)。上述结果表明,内含子与相应外显子连接序列的相互作用对外显子的边界是敏感的。第一内含子中高GC含量匹配片段在EJC区域出现更加明显的极小值,而低GC片段在多个区域显示出这一特征。3 讨论
【参考文献】:
期刊论文
[1]果蝇成熟mRNA序列与其相应内含子序列的匹配特征分析[J]. 薄素玲,李宏,张强,杨振华,包通嘎拉,应智强,赵小庆. 内蒙古大学学报(自然科学版). 2018(06)
[2]基因外显子连接序列与相应内含子序列的相互作用[J]. 张强,李宏,赵小庆,许士华. 生物信息学. 2013(03)
[3]线虫核糖核蛋白基因内含子与相应编码序列的相互作用[J]. 赵小庆,李宏,包通拉嘎. 生物化学与生物物理进展. 2010(09)
本文编号:3384161
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3384161.html
最近更新
教材专著