在GM12878和K562两种细胞系中组蛋白修饰的分布及其与基因表达关系研究
发布时间:2020-06-30 20:40
【摘要】:近年来,高通量测序技术的快速发展在表观遗传方面产生了海量的数据,这些大数据隐含了很多表观修饰的生物学功能,如何去揭示表观修饰的生物学功能迫切地需要我们这些生物信息工作者的参与。此外,组蛋白修饰作为最重要的表观修饰之一,它不仅与基因表达有一定的关系,而且对于癌症的发生也有关键的调节作用。因此,了解组蛋白修饰对癌症发生的调控机制和对癌症的治疗都有一定的帮助。本论文选用了人类血液组织中正常细胞系GM12878和血液组织中癌变细胞系K562作为研究对象;在GM12878细胞系和K562细胞系里分别计算了癌基因的表达值与11种组蛋白修饰之间的Spearman相关性大小;在K562中对多种组蛋白修饰进行聚类分析,构造了血癌中癌基因的组蛋白修饰簇;建立了K562中癌基因的11种组蛋白修饰的偏相关网络图;在DAVID数据库中对血癌中的癌基因作了GO功能和KEGG通路分析。文中详细的研究内容如下:1.研究了启动子区域11种组蛋白修饰在癌基因上的分布情况。结果表明,不同组蛋白修饰在基因启动子区域里偏好的位置也是不同的,有些组蛋白修饰会出现在转录起始位点(TSS)附近的两端,有些组蛋白修饰会出现在转录起始位点下游的位置,还有一部分在启动子区域很少出现。2.计算了组蛋白修饰与基因表达之间的Spearman相关性,找出了调控血癌发生的4种重要组蛋白修饰分别是H3K9ac、H3K27ac、H3K79me2和H3K36me3。从多元线性回归的理论中也得到了这4种组蛋白修饰在血癌中调控的重要性。3.重新筛选癌基因,在K562中构造了与癌基因有关的组蛋白修饰偏相关网络图。对多种组蛋白修饰作了聚类分析,发现了原癌基因中有两个关联性很强的组蛋白修饰簇(H3K4me3、H3K4me2、H3K79me2、H3K9ac、H3K27ac)和(H3K4me1、H3K36me3),而在抑癌基因中有1个关联性很强的组蛋白修饰簇(H3K4me2、H3K4me3、H2az、H3K9ac、H3K27ac、H3K79me2、H3K4me1)。4.在DAVID数据库中对癌基因作了GO功能和KEGG通路分析,再与超级增强子调控的细胞身份基因取交集,得到了调控血癌发生的4个关键原癌基因FOXL2、GATA1、LYL1和TRIM24;调控血癌发生的1个关键抑癌基因PTEN。
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:Q78;R730.2
【图文】:
内蒙古大学硕士毕业论文强子是基因序列上的一段重要的调控作用元件,而超级增强子是由多个因序列。目前的研究表明,超级增强子不仅比增强子跨越更长的基更强的促进能力,对基因表达有更强的调控作用[48]。此外Whyte等控的基因具有细胞特异性[48,49]。与正常细胞相比,超级增强子在肿癌基因[50]。而且超级增强子受到人们越来越多的关注,目前超级增表性的数据库,dbSUPER(http://bioinfo.au.tsinghua.edu.cn/dbsuper/)g),其中dbSUPER数据库是由清华大学张学工教授团队建立的,该集了Young团队预测出来的数据。SEA数据库是由哈尔滨医科大学张据库的数据收集了GEO等大型公共数据库的数据。
第三章 组蛋白修饰在血癌中的特征3.1 基因表达值比较我们利用公式(2-2)分别计算了 oncogene 和 TSG 在 GM12878 中和在 K562 细胞系KM 值。我们把 K562 细胞系中 oncogene 和 TSG 按照 RPKM 值的高低排序,把 oncRPKM 值是前 50%的基因作为研究的原癌基因,把 RPKM 值为后 50%的 TSG 作为研基因并把它们的表达值作了箱线图(图 3.1)。我们能够发现大多数 oncogene 在 K5 GM12878 细胞系中的表达量高,大多数 TSG 在 GM12878 中比在 K562 细胞系中的。这也是前人在癌症的研究中发现的有关癌基因表达的普遍规律。
本文编号:2735792
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:Q78;R730.2
【图文】:
内蒙古大学硕士毕业论文强子是基因序列上的一段重要的调控作用元件,而超级增强子是由多个因序列。目前的研究表明,超级增强子不仅比增强子跨越更长的基更强的促进能力,对基因表达有更强的调控作用[48]。此外Whyte等控的基因具有细胞特异性[48,49]。与正常细胞相比,超级增强子在肿癌基因[50]。而且超级增强子受到人们越来越多的关注,目前超级增表性的数据库,dbSUPER(http://bioinfo.au.tsinghua.edu.cn/dbsuper/)g),其中dbSUPER数据库是由清华大学张学工教授团队建立的,该集了Young团队预测出来的数据。SEA数据库是由哈尔滨医科大学张据库的数据收集了GEO等大型公共数据库的数据。
第三章 组蛋白修饰在血癌中的特征3.1 基因表达值比较我们利用公式(2-2)分别计算了 oncogene 和 TSG 在 GM12878 中和在 K562 细胞系KM 值。我们把 K562 细胞系中 oncogene 和 TSG 按照 RPKM 值的高低排序,把 oncRPKM 值是前 50%的基因作为研究的原癌基因,把 RPKM 值为后 50%的 TSG 作为研基因并把它们的表达值作了箱线图(图 3.1)。我们能够发现大多数 oncogene 在 K5 GM12878 细胞系中的表达量高,大多数 TSG 在 GM12878 中比在 K562 细胞系中的。这也是前人在癌症的研究中发现的有关癌基因表达的普遍规律。
【参考文献】
相关期刊论文 前1条
1 孙芳;潘云;李艳;;组蛋白修饰在常见血液系统肿瘤中作用的研究进展[J];中国实验血液学杂志;2015年04期
本文编号:2735792
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2735792.html
最近更新
教材专著