埃博拉病毒(Ebolavirus)基因组中微卫星序列的分布分析
发布时间:2020-04-18 04:12
【摘要】:微卫星序列(Microsatellite)是基因组中普遍存在的一种简单重复序列(Simple Sequence Repeat,SSR),数量丰富,分布广泛,具有高度多态性。大量研究表明,作为基因组中一个重要的组分,微卫星在基因中非编码区,编码区和基因间区中都有大量分布,且影响着蛋白的功能,生物遗传以及基因调控,是基因组研究领域热点之一。本论文内容主要涉及以下两个方面:1.埃博拉病毒(Ebolavirus)基因组中微卫星分布分析(第二章)在本章中选择了36条埃博拉病毒属的四个不同种的埃博拉病毒全基因组序列作为实验材料,利用IMEX在线提取软件提取微卫星,用Python语言编程统计数据,从而分析微卫星在埃博拉病毒全基因组序列中的分布情况。分析得出,埃博拉病毒基因组序列中二型微卫星含量最为丰富,其次是一型微卫星,三型微卫星有少量,四型微卫星则更少,没有发现五型和六型微卫星。在更深入的分析中得出在埃博拉病毒属四个种中的含AT碱基的微卫星含量远远大于含CG碱基的微卫星含量。通过对这四种埃博拉病毒种的病毒基因组序列中微卫星的分析,有助于更好的理解埃博拉病毒基因组的进化,为研究埃博拉病毒的变异情况及其致病机制研究提供更多参考。2.64条埃博拉病毒基因组中微卫星分布图谱及特征分布分析(第三章)在此工作中选择了64条埃博拉病毒属的五个不同种的埃博拉病毒全基因组序列作为实验材料,在第一个工作中对36条埃博拉病毒基因组序列中微卫星的相关分布统计信息情况做了研究,但其分析是在平均和整体的水平上分析,无法得到细节信息。在此工作中,使用本研究组开发的分析工具微卫星微分计算器(Differential Calculator of Microsatellite,DCM),对五个不同种的埃博拉病毒全基因组序列进行进一步更细致的分析,借助R语言编程将微分结果可视化,得出微卫星序列在埃博拉基因组不同区域中的分布模式图,并从其中找出微卫星分布具有特异性的区域,随后定位到相应的特异性位点,这些位点可能对埃博拉病毒不同种致病性研究起着重要的推动作用。分析得出,微卫星在基因组不同区域上是非随机分布的,其在病毒基因组上的分布存在区域偏好性,且不同致病性的埃博拉病毒种型中微卫星在基因组同一区域上的分布是存在差异的。不同种埃博拉病毒基因组中微卫星的特征分布可能存在差异并反映其对不同环境的适应性。因此,通过分析微卫星的特征分布我们可以寻找到种属特异性片段,以及探索埃博拉病毒基因组上微卫星序列对病毒基因组变异和进化的影响。
【图文】:
埃博拉病毒是一种侵袭性病原体,是一种导致人类和非人类灵长类动物出现高致死性出血热综合征的传染病病毒。埃博拉是单股负链 RNA 病毒,是丝状病毒科中的一个属,呈长约 970 纳米的丝状。每个病毒个体是由负链核糖核酸病毒粒子构成。在基因组的 3·端没有发生多聚腺苷酸化,同时在 5·端也未见加帽。其基因组长约 19kb,具有编码 结 构 蛋 白 和 非 结 构 蛋 白 的 七 个 开 放 阅 读 框 , 基 因 顺 序 是 : 3· 端NP VP35 VP40 GP VP30 VP24 L 5·端,在 3·端和 5·端的非编码区调节病毒的转录、复制以及新病毒粒子的组装。如果缺少某一种重要的蛋白,单靠其基因组并没有感染性。其中 RNA 依赖的 RNA 聚合酶为 L 蛋白,是转录成病毒基因组对应的的m RNA 必须的酶,它在病毒复制过程中也起到关键作用。NP 基因编译的蛋白是核衣壳蛋白,与病毒遗传物质 RNA 带组装构成病毒颗粒中心的螺旋结构,VP30 和 VP35 基因编码的蛋白是病毒结构蛋白, VP35 蛋白具有典型的抗 I 型干扰素的作用,GP 基因编码的蛋白是跨膜糖蛋白,病毒入侵及其细胞毒性与 GP 蛋白密切相关,VP24 和 VP40基因编码的蛋白与病毒的成熟释放相关, 前者是小型膜蛋白,后者是病毒基质蛋白[25-27]。
(mono-、di-、tri-、tetra-、penta-和 hexanucleotide)进行分析,最小迭代次数分别是 63,3,3,3,3。我们选用软件 IMEx(Imperfect Microsatellite Extractor)[44]对实验所用材料序列进行微卫星的抽提。IMEx 是一种能够提取来自基因组序列的微卫星,并用于分析微卫星分布的软件[45]它既能提取原始序列中的存在的完美的微卫星,也能识别不完美的微卫星,,研究者可以根据需要通过设置不同的参数进行微卫星提取。IMEX 是以网页服务器的形式存在的一个独立程序的形式。在上传原始序列的 fasta 格式文件后,设定 IMEx 相关参数,利用这个软件在线提取每条序列中的微卫星序列,得到微卫星在序列不同位置的具体分布情况。参数设置如图 2.1 所示,选择 IMEx 程序(http://www.cdfd.org.in/imex)的高级模式提取的完美微卫星序列,一型、二型、三型、四型、五型、六型微卫星的基序最低迭代次数分别设定为 6、3、3、3、3、3。IMEx 提取得到的数据为 txt 格式文件,包含了微卫星的基序类型、迭代次数以及其在基因组中的起止位置等信息,随后用 Excel 处理即可得到微卫星的个数、类型、长度、相对丰度、相对密度、出现频率和最长重复序列等相关信息[46]。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R373
【图文】:
埃博拉病毒是一种侵袭性病原体,是一种导致人类和非人类灵长类动物出现高致死性出血热综合征的传染病病毒。埃博拉是单股负链 RNA 病毒,是丝状病毒科中的一个属,呈长约 970 纳米的丝状。每个病毒个体是由负链核糖核酸病毒粒子构成。在基因组的 3·端没有发生多聚腺苷酸化,同时在 5·端也未见加帽。其基因组长约 19kb,具有编码 结 构 蛋 白 和 非 结 构 蛋 白 的 七 个 开 放 阅 读 框 , 基 因 顺 序 是 : 3· 端NP VP35 VP40 GP VP30 VP24 L 5·端,在 3·端和 5·端的非编码区调节病毒的转录、复制以及新病毒粒子的组装。如果缺少某一种重要的蛋白,单靠其基因组并没有感染性。其中 RNA 依赖的 RNA 聚合酶为 L 蛋白,是转录成病毒基因组对应的的m RNA 必须的酶,它在病毒复制过程中也起到关键作用。NP 基因编译的蛋白是核衣壳蛋白,与病毒遗传物质 RNA 带组装构成病毒颗粒中心的螺旋结构,VP30 和 VP35 基因编码的蛋白是病毒结构蛋白, VP35 蛋白具有典型的抗 I 型干扰素的作用,GP 基因编码的蛋白是跨膜糖蛋白,病毒入侵及其细胞毒性与 GP 蛋白密切相关,VP24 和 VP40基因编码的蛋白与病毒的成熟释放相关, 前者是小型膜蛋白,后者是病毒基质蛋白[25-27]。
(mono-、di-、tri-、tetra-、penta-和 hexanucleotide)进行分析,最小迭代次数分别是 63,3,3,3,3。我们选用软件 IMEx(Imperfect Microsatellite Extractor)[44]对实验所用材料序列进行微卫星的抽提。IMEx 是一种能够提取来自基因组序列的微卫星,并用于分析微卫星分布的软件[45]它既能提取原始序列中的存在的完美的微卫星,也能识别不完美的微卫星,,研究者可以根据需要通过设置不同的参数进行微卫星提取。IMEX 是以网页服务器的形式存在的一个独立程序的形式。在上传原始序列的 fasta 格式文件后,设定 IMEx 相关参数,利用这个软件在线提取每条序列中的微卫星序列,得到微卫星在序列不同位置的具体分布情况。参数设置如图 2.1 所示,选择 IMEx 程序(http://www.cdfd.org.in/imex)的高级模式提取的完美微卫星序列,一型、二型、三型、四型、五型、六型微卫星的基序最低迭代次数分别设定为 6、3、3、3、3、3。IMEx 提取得到的数据为 txt 格式文件,包含了微卫星的基序类型、迭代次数以及其在基因组中的起止位置等信息,随后用 Excel 处理即可得到微卫星的个数、类型、长度、相对丰度、相对密度、出现频率和最长重复序列等相关信息[46]。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R373
【参考文献】
相关期刊论文 前4条
1 孙丹;范余娟;徐红;范江涛;;子宫内膜癌中人类乳腺癌易感基因1微卫星不稳定性及其与临床病理的关系[J];实用医学杂志;2015年22期
2 杨兴娄;葛行义;胡r
本文编号:2631703
本文链接:https://www.wllwen.com/xiyixuelunwen/2631703.html
最近更新
教材专著