转录组学研究人肿瘤细胞的表达调控机制和大熊猫基因组重注释
发布时间:2020-08-22 21:04
【摘要】:基因表达调控是促使细胞分化和器官形成,最终在多细胞生物中产生不同细胞类型的关键,是真核生物各种细胞或组织行使不同功能所必需的。通过转录组数据分析可以在转录水平上研究基因表达调控。RNA-Sequencing (RNA-Seq)是当前非常有效的可以定性和定量化分析转录组的技术,被广泛应用于基因表达调控领域的研究。同时RNA-Seq技术是一种随机化的深度测序,它的另一个重要应用是基因组重注释。高质量、完整的基因组注释是转录组下游分析的基础,包括基因表达分析、表观遗传分析、系统发育分析等。基于此本论文充分利用RNA-Seq方法开展了人和大熊猫转录组数据的深度挖掘,主要目的是研究人体中不同肿瘤细胞和对应的正常组织之间表达模式的差异,揭示肿瘤细胞的表达调控机制,同时利用深度测序方法完善大熊猫基因组的注释。 (一)以往大部分关于肿瘤机制或其它疾病类型的研究通常是比较同一组织来源的正常样本和对应病理样本的差异性,获得应对特定疾病信号主要的基因。本文分析的基本问题是怎样衡量不同肿瘤细胞和对应的正常组织之间表达模式的差异。目前已有人类许多不同组织或细胞系的RNA-Seq转录组数据,这为本研究提供了必要的前提和可能。我们主要从三个方面来定义基因表达模式:(1)表达宽度,反应基因表达开/关状态;(2)基因表达水平和变化程度,即基因的高/低表达和恒定/变化表达;(3)基因表达在基因结构上的调控。基因表达谱聚类结果显示肿瘤细胞基因表达模式变化主要与生理状态相关,其次才是组织来源。依据组织或细胞生理条件类型分别定义了两种不同类型的housekeeping (HK)基因。首次采用改进的K均值算法和改进的基因表达变化模型来描述基因表达水平和变化模式。结果发现细胞在肿瘤生理状态下关闭部分基因,上调肿瘤相关的HK基因的表达,并调控这类基因在不同肿瘤细胞间变化表达。肿瘤细胞调节的这些基因主要是参与细胞周期调控相关功能的基因,包含了许多肿瘤特征基因。肿瘤细胞主要选择表达富含AT的基因,并且避免表达大基因以维持细胞无限的自我增殖能力。该研究对于我们认识细胞在不同生理状态下内在的基因表达模式调控机制有很大的帮助,尤其是肿瘤细胞。 (二)利用RNA-Seq技术测序了大熊猫的肝脏、骨骼肌、大脑皮层、垂体、舌头、胃、小肠、结肠、睾丸、卵巢、黑皮和白皮这12个不同组织样本的转录组,用于发现大熊猫有转录表达的新基因。转录组数据定位(mapping)结果显示大约50%左右的编码信息在当前大熊猫的基因组注释中缺失。运用基于参考序列方法的Cufflinks与de novo方法中的Trinity相结合的策略,从12个组织转录组中构建一个全面综合的注释结果。其中Trinity组装的转录本可以评估基因组组装质量和提高基因组中编码基因区的完整性。经过表达和同源验证,结果中一共发现三类有转录表达的全长新基因:(1)1076个基于同源的新基因,这类基因与某一已知蛋白氨基酸顺序,还有某一已知cDNA核苷酸顺序完全一致或相当一致;(2)10494个未知的新基因,这类基因有同源的EST序列,但是没有同源蛋白或同源cDNA序列;(3)12575个推测的新基因,这类新基因有完整的开放阅读框,但是没有任何同源序列。这些新基因可以修复基因组的注释,是对基因组自动注释系统的有效补充。完整的基因组注释可以为后续的比较基因组学、重测序和转录组学研究提供更可靠的信息。
【学位授予单位】:中国科学院北京基因组研究所
【学位级别】:博士
【学位授予年份】:2013
【分类号】:R3411;S865.31
本文编号:2801147
【学位授予单位】:中国科学院北京基因组研究所
【学位级别】:博士
【学位授予年份】:2013
【分类号】:R3411;S865.31
【参考文献】
相关期刊论文 前2条
1 于凤池;EST技术及其应用综述[J];中国农学通报;2005年02期
2 刘万飞;王西亮;赵宇慧;曾p瑶;耿佳宁;胡松年;;基于第二代测序技术的细菌基因组与转录组研究策略简介[J];微生物学通报;2011年11期
本文编号:2801147
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/2801147.html
最近更新
教材专著