植物G-四链体大数据比较分析及数据库构建
发布时间:2020-12-16 00:11
G-四链体(G-quadruplex,G-Q)是富含G的序列折叠形成的高级DNA或者RNA二级结构,其结构单元为G-四分体(G-quartet)。G-四分体是由氢键结合鸟嘌呤碱基形成的环形平面。G-Q广泛地存在于植物基因组中,且参与了转录、翻译、端粒维持等重要的生理进程。尽管目前有大量预测和研究G-Q的工具及数据库,但是针对植物的研究却十分匮乏。随着下一代测序技术的成熟以及测序成本的不断降低,大量的植物基因组被组装和注释。为了更好地促进植物中G-Q大数据的挖掘及分析,本研究采用公共数据平台中获得的植物基因组及注释信息,采用生物信息学统计及分析方法,以及利用结构配对的方法对植物基因组中的G-Q进行挖掘和注释。利用挖掘到的所有G-Q信息,构建了一个全面的综合的界面友好的开放型数据库。本研究主要成果如下:(1)植物基因组信息资源库的构建。通过对植物基因组文章的阅读与信息采集,获取了195个植物的基因组及注释文件。物种的拉丁名、英文名、发表时间、版本号、参考文献名称及获取地址、基因组获取地址、基因组大小等详细信息被提取出来,利用这些信息构建了一个植物基因组信息资源库。(2)G-Q大数据的挖掘及...
【文章来源】:山东农业大学山东省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
Plant-GQ数据库的示意图
图 2 不同科中 G-Q结构分布图Fig. 2 G-Q structure distribution in different families3.4 同一科内不同类型 G-Q 结构的分布及比对为了观察 G-Q 结构在同一科中的存在频率及分布情况,分别对禾本科、十字花科以及茄科中的 G-Q 结构进行了统计及分析。对禾本科的 6 个物种的不同类型的 G-Q 结构在基因组上的分布频率及基因组等信息进行统计(表 3),结果表明,每 Kb基因组中两单元 G-Q 出现的频率最高,频率范围为 2 到 6 之间,其中二穗短柄草出现频率最高,茭白出现的频率最低,每 Kb 基因组中两单元 G-Q 所占的频率基本上在3 到 4 左右。每 Kb 基因组中三单元 G-Q 出现的频率占居第二,频率范围为 0.04 到0.2 之间,其中二穗短柄草出现频率最高,而茭白出现频率最低,整体的频率在 0.1上下浮动。每 Kb 基因组中三单元 G-Q 出现的频率最少,频率范围为 0.009 到 0.02 之间,其中短花药野生稻出现频率最高,茭白出现频率最低,整体频率在 0.01 上下浮动。综上所述,在禾本科植物中,仍具有两单元 G-Q 结构在基因组出现的频率最
结构在基因上的数目与基因间的数目相差不大(图 3)。玉米中两种位置的 G-Q 结构的数量相差较大。综上所述,在豆科中,在基因上的 G-Q 结构的数量要小于基因间的 G-Q结构的数量,大部分物种中,两种位置的 G-Q的数量相差不大。表 3 禾本科中 G-Q结构单元密度统计Table 3 Density statistics of G-Q structural units in Grass family物种Species二聚体数量/KbNumber of TwoG-tracts/Kb三聚体数量/KbNumber of ThreeG-tracts/Kb四聚体数量/KbNumber of FourG-tracts/Kb基因组大小Genomic size(Mb)科familyOryza longistaminata3.268424 0.089231 0.009441 347禾本科Oryza brachyantha3.481874 0.107909 0.01936 253禾本科Brachypodium distachyon5.532685 0.163973 0.016265 260禾本科Oryza glaberrima4.3775 0.133718 0.014038 316禾本科Zea mays5.075372 0.143022 0.013982 2,300禾本科Zizania latifolia2.078647 0.045551 0.001654 590禾本科
本文编号:2919149
【文章来源】:山东农业大学山东省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
Plant-GQ数据库的示意图
图 2 不同科中 G-Q结构分布图Fig. 2 G-Q structure distribution in different families3.4 同一科内不同类型 G-Q 结构的分布及比对为了观察 G-Q 结构在同一科中的存在频率及分布情况,分别对禾本科、十字花科以及茄科中的 G-Q 结构进行了统计及分析。对禾本科的 6 个物种的不同类型的 G-Q 结构在基因组上的分布频率及基因组等信息进行统计(表 3),结果表明,每 Kb基因组中两单元 G-Q 出现的频率最高,频率范围为 2 到 6 之间,其中二穗短柄草出现频率最高,茭白出现的频率最低,每 Kb 基因组中两单元 G-Q 所占的频率基本上在3 到 4 左右。每 Kb 基因组中三单元 G-Q 出现的频率占居第二,频率范围为 0.04 到0.2 之间,其中二穗短柄草出现频率最高,而茭白出现频率最低,整体的频率在 0.1上下浮动。每 Kb 基因组中三单元 G-Q 出现的频率最少,频率范围为 0.009 到 0.02 之间,其中短花药野生稻出现频率最高,茭白出现频率最低,整体频率在 0.01 上下浮动。综上所述,在禾本科植物中,仍具有两单元 G-Q 结构在基因组出现的频率最
结构在基因上的数目与基因间的数目相差不大(图 3)。玉米中两种位置的 G-Q 结构的数量相差较大。综上所述,在豆科中,在基因上的 G-Q 结构的数量要小于基因间的 G-Q结构的数量,大部分物种中,两种位置的 G-Q的数量相差不大。表 3 禾本科中 G-Q结构单元密度统计Table 3 Density statistics of G-Q structural units in Grass family物种Species二聚体数量/KbNumber of TwoG-tracts/Kb三聚体数量/KbNumber of ThreeG-tracts/Kb四聚体数量/KbNumber of FourG-tracts/Kb基因组大小Genomic size(Mb)科familyOryza longistaminata3.268424 0.089231 0.009441 347禾本科Oryza brachyantha3.481874 0.107909 0.01936 253禾本科Brachypodium distachyon5.532685 0.163973 0.016265 260禾本科Oryza glaberrima4.3775 0.133718 0.014038 316禾本科Zea mays5.075372 0.143022 0.013982 2,300禾本科Zizania latifolia2.078647 0.045551 0.001654 590禾本科
本文编号:2919149
本文链接:https://www.wllwen.com/projectlw/swxlw/2919149.html
教材专著