大数据先验模式构建膀胱癌非编码RNA全景图谱及SCARNA12的分子机制研究
发布时间:2020-08-01 20:40
【摘要】:数据先验的理念正在改变各行各业的行为模式,其中以临床大数据为支撑的人工智能医疗在临床影像学、临床病理学等诊断疾病上展示出了超高的诊断效力。值得一提的是,生物组学大数据在个性化分析复杂性疾病中展示出独特的优势,有利于研究者深入全面了解疾病的概貌,发现个性化信息,为基础实验研究和临床治疗策略提供更加精细的指导,这也进一步巩固了组学技术近年来在精准医疗领域不可撼动的地位。然而遗憾的是,大数据先验模式在实验生物学领域推广却较为缓慢。国际大型生物组学大数据计划已经积累了海量数据,组学检测成本的降低使得生物学数据呈指数增长,利用好组学大数据,不仅能够为实验生物学节约研究成本,而且能够研究者提供更加多维全面的信息,达到缩短研究周期,推动基础实验更加高效地发现问题和解决问题。膀胱癌是严重威胁人类健康的一种恶性肿瘤类型,但目前对膀胱癌分子机制的研究依然不清,导致临床预防、监测和治疗捉襟见肘。组学大数据让人们认识到非编码RNA在控制基因表达,转录、转录后修饰和信号转导等诸多方面的重要性,大量非编码RNA已被鉴定为主要肿瘤类型中的致癌驱动因子和肿瘤抑制因子。遗憾的是,目前缺乏针对膀胱癌转录组学大数据多水平个性化高精度地分析。本论文利用大数据先验和实验学后验的模式对膀胱癌两种小分子事件进行研究。在大数据先验部分构建了研究较为成熟的长链非编码RNA(long non-coding RNA,lncRNA)和目前研究相对空白的核仁小分子RNA(small nucleolar RNA,snoRNA)表达全景图,同时也首次构建了膀胱癌mRNA以及本课题组感兴趣的卡哈尔体(Cajal body,CB)相关核小分子RNA(Cajal body small nucleolar RNA,scaRNA)的相关转录因子全景图及可变剪切表达全景图,在此过程中提供了若干计算分析框架。在实验后验部分通过对多细胞系水平及临床肿瘤组织水平RT-qPCR验证,CRISPR-Cas9敲低实验,mRNA高通量测序,原位杂交,裸鼠成瘤及RNA纯化染色质分离技术(ChIRP)等实验手段,对数据先验的结果进行了生物学意义的验证。第一部分工作获取了TCGA数据库中膀胱癌最新注释共13,918个lncRNA的测序表达数据,构建了膀胱癌中差异lncRNA表达(differentially expressed lncRNAs,DELs)谱,通过系统地整合预后信息,更新并构建了膀胱癌DELs预后预测模型。新预后模型在预测肿瘤患者预后、肿瘤大小、淋巴结浸润和病理分期上较单一指标效果提升显著,值得一提的是,该指数可成为膀胱癌预后独立的影响因素。最后,本部分在细胞系和组织样本水平对计算获取的DELs稳固性进行了部分验证。这部分工作提供了膀胱癌中DELs更为全面的解读,为lncRNA实验研究提供了详尽的参阅信息。第二部分工作利用膀胱癌组织1,232个小RNA-seq水平的数据,全面精确绘制了膀胱癌中研究空白的snoRNA表达谱。结果显示,这类目前在膀胱癌中尚未引起研究者足够重视的小分子在肿瘤组织和正常组织中的表达存在明显差异,并且数目多达230个,部分snoRNA对预判膀胱癌具有较高价值,提示部分snoRNA可能对膀胱癌的生物学行为具有重要贡献。根据数据先验的结果,我们对部分snoRNA的计算可靠性结果进行细胞和组织水平qPCR验证,为膀胱癌snoRNA研究提供了参选点依据。根据数据先验的提示,选取了与本课题组前期研究Cajal body相关,并且在膀胱癌中显著高表达以及具有较高疾病预判能力的SCARNA12进行深入研究。本部分利用real time RT-qPCR在临床膀胱癌组织和多细胞系水平验证了SCARNA12的表达水平,采用原位杂交进一步确定了SCARNA12在组织层面的分布特征。通过“表达相关基因最有可能是互相调控和影响”的理论,本课题首次构建了以SCARNA12为代表的SCARNA小分子功能分析框架,基因富集分析算法解析了SCARNA12在膀胱癌中发挥作用的主要潜在方式。第三部分工作中,本课题首次利用CRISPR-Cas9基因编辑技构建T24细胞系SCARNA12敲低模型进行功能探索。SCARNA12敲低后,显著抑制了膀胱癌细胞生长,癌细胞停滞在G0/G1期,不能完全进入细胞周期S期,从而导致了细胞增殖速度减慢。SCARNA12对膀胱癌细胞的生长抑制也可能通过诱导凋亡而实现,SCARNA12敲低后,晚期凋亡显著增加。此外,我们还发现敲低后的T24细胞侵袭能力降低。裸鼠成瘤实验瘤体有缩小的趋势。目前,世界上尚无关于SCARNA在膀胱癌的研究方案可参考,膀胱癌中也无类似指标的研究可推测SCARNA发挥生物学功能的方式,我们首次通过实验验证了数据先验的稳固性,并全面展示了SCARNA12体内外水平的功能。第四部分工作尝试对SCARNA12的分子机制进行解读。我们首次利用RNA-seq技术在全基因组转录水平检测SCARNA12敲低前后转录组的变化。SCARNA12敲低显著影响了多达1,155个基因的表达量,并且与细胞外基质相关的通路富集频率最高,与大数据分析结果吻合,这是首次以高通量测序数据在mRNA层面阐明SCARNA12发挥功能的方式。然后,我们成功的首次使用RNA纯化染色质分离技术(ChIRP)获取了SCARNA12互作结合调控的蛋白,发现组蛋白家族成员H2AFZ(H2A histone family member Z,H2AFZ)与MYCN(MYCN proto-oncogene,BHLH transcription factor)等蛋白与SCARNA12存在物理空间位置的结合。特别意思的是,本课题首次结合转录因子算法(Binding Analysis for Regulation of Transcription,BART)发现H2AFZ与MYCN均非常可能是SCARNA12敲低以后的差异基因的上游调控的因子。在首次整合现所有公开针对组蛋白相关基因H2AFZ与转录因子MYCN ChIP-seq大数据分析时发现,H2AFZ潜在靶基因为E3泛素蛋白连接酶(deltex E3 ubiquitin ligase 3,DTX3),MYCN潜在靶基因为连接粘附分子2(junctional adhesion molecule 2,JAM2)和核因子IX(nuclear factor I X,NFIX)。这为以SCARNA12为代表的snoRNA在基因层面转录调控深入分析提供了参考标准。第五部分工作首次展示了膀胱癌细胞水平SCARNA12敲低后可变剪切事件谱以及膀胱癌大数据组织水平可变剪切的全貌。可变剪切事件分析是较mRNA水平更加精确的分析,在敲低SCARNA12后共发生了多达156个显著的可变剪接事件,并且出现了6个未见任何报道的新的剪接体。结合临床膀胱癌组织水平数据,整合膀胱癌预后信息,我们发现了在9,731个基因中共检测到高达39,508个mRNA剪接事件,提示膀胱癌组织中可变剪切事件的发生并非偶然事件。其中基因细丝蛋白A(filamin A,FLNA)在组织和细胞水平均发生了外显子跳跃的可变剪接事件,并且具有预后评估的价值。这部分工作为后续膀胱癌以及SCARNA12可变剪切研究策略的制定提供了有力的证据支持。
【学位授予单位】:广西医科大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:R737.14
【图文】:
12图 1 生物医学大数据现状示意图Figure 1 Schematic model of biomedical “BIG DATA”The BIG DATAconsists of ‘Omics & Systems Biology’, ‘Drugs & Other Chemicals’, ‘Biomedical Literature’, ‘Clinical Data’, ‘Biomedical Imaging’and etc.https://www.slideshare.net/mmayer/big-data-big-opportunity-47367009
大数据先验模式构建膀胱癌非编码 RNA 全景图谱及 SCARNA12 的分子机制研究 2019 届博士学位论文膀胱癌(bladdercancer,BLCA)是男性中第四大常见癌症,也是女性中第 11 位最常见的癌症,全球每年有超过 430,000 例癌症[12]。根据 2019 年美国最新的膀胱癌流行病学数据,2019 年预计新发病例约为 80,470 例,其中男性 61,700 例,女性 18,770 例,预计死亡总数 17,670 名,包括 12,870 名男性和 4,800 名女性[13](图 2)。在中国,膀胱癌是 2015 年最常见的第 13种癌症,总数为 80,500 例[14]。然而,膀胱癌的分子机制仍然很不清楚,导致膀胱癌筛查,监测或预后分层的特定生物标志物的缺乏[15-19]。因此,迫切需要对膀胱癌的发生发展分子机制进行深入研究。
图 3 非编码 RNA 分类Figure 3 Classification of non-coding RNAsThe human genome consists of approximately 2% protein-coding sequences, which can bemessenger RNAs (mRNAs) and then translated into proteins. The majority of the human gnonprotein-coding DNA, which can be transcribed in (functional) noncoding RNAs (ncRNto their size and function, ncRNAs can be grouped into long noncoding RNAs (lncRNAncRNAs. The group of small ncRNAs, which are less than 200 nucleotides (nt) in lengthmicroRNAs (miRNAs), piwi-interacting RNAs (piRNAs), ribosomal RNAs (rRNAs), smspecific RNAs (scaRNAs), small-interfering RNAs (siRNAs), small nuclear RNAs (snRnucleolar RNAs (snoRNAs), and transfer RNAs (tRNAs). Beside their biogenesis from hamolecules, miRNAs can also be derived from lncRNAs and snoRNAs (highlighted in目前,某些 lncRNA 在膀胱癌中的临床意义及机制得到了报于大数据针对lncRNA预后模型的建立及验证未见报道。对于小分miRNA 在膀胱癌中的作用研究较多,部分研究针对测序数据和
本文编号:2777977
【学位授予单位】:广西医科大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:R737.14
【图文】:
12图 1 生物医学大数据现状示意图Figure 1 Schematic model of biomedical “BIG DATA”The BIG DATAconsists of ‘Omics & Systems Biology’, ‘Drugs & Other Chemicals’, ‘Biomedical Literature’, ‘Clinical Data’, ‘Biomedical Imaging’and etc.https://www.slideshare.net/mmayer/big-data-big-opportunity-47367009
大数据先验模式构建膀胱癌非编码 RNA 全景图谱及 SCARNA12 的分子机制研究 2019 届博士学位论文膀胱癌(bladdercancer,BLCA)是男性中第四大常见癌症,也是女性中第 11 位最常见的癌症,全球每年有超过 430,000 例癌症[12]。根据 2019 年美国最新的膀胱癌流行病学数据,2019 年预计新发病例约为 80,470 例,其中男性 61,700 例,女性 18,770 例,预计死亡总数 17,670 名,包括 12,870 名男性和 4,800 名女性[13](图 2)。在中国,膀胱癌是 2015 年最常见的第 13种癌症,总数为 80,500 例[14]。然而,膀胱癌的分子机制仍然很不清楚,导致膀胱癌筛查,监测或预后分层的特定生物标志物的缺乏[15-19]。因此,迫切需要对膀胱癌的发生发展分子机制进行深入研究。
图 3 非编码 RNA 分类Figure 3 Classification of non-coding RNAsThe human genome consists of approximately 2% protein-coding sequences, which can bemessenger RNAs (mRNAs) and then translated into proteins. The majority of the human gnonprotein-coding DNA, which can be transcribed in (functional) noncoding RNAs (ncRNto their size and function, ncRNAs can be grouped into long noncoding RNAs (lncRNAncRNAs. The group of small ncRNAs, which are less than 200 nucleotides (nt) in lengthmicroRNAs (miRNAs), piwi-interacting RNAs (piRNAs), ribosomal RNAs (rRNAs), smspecific RNAs (scaRNAs), small-interfering RNAs (siRNAs), small nuclear RNAs (snRnucleolar RNAs (snoRNAs), and transfer RNAs (tRNAs). Beside their biogenesis from hamolecules, miRNAs can also be derived from lncRNAs and snoRNAs (highlighted in目前,某些 lncRNA 在膀胱癌中的临床意义及机制得到了报于大数据针对lncRNA预后模型的建立及验证未见报道。对于小分miRNA 在膀胱癌中的作用研究较多,部分研究针对测序数据和
本文编号:2777977
本文链接:https://www.wllwen.com/yixuelunwen/mjlw/2777977.html
最近更新
教材专著