转移性黑素瘤调控机制的生物信息学分析及CLDN4对黑素瘤生物学行为影响
发布时间:2021-03-29 02:09
目的 通过生物信息学的方法对TCGA数据库中人恶性黑素瘤的芯片测序数据进行整合分析,寻找转移性恶性黑素瘤的核心基因,并预测其转录调控因子。同时构建基于lnc RNA-mi RNA-m RNA的ce RNA调控网络。方法 通过下载TCGA数据库中471例黑素瘤组织的芯片数据,并采用R语言包3.4软件进行数据统计学分析,采用加权基因共表达网络分析的方法对恶性黑素瘤的核心基因进行筛选,同时构建蛋白质-蛋白质相互作用网络关系。进而利用生物信息学网站预测调控核心基因的转录因子,并利用多个生信数据库构建基于lnc RNA-mi RNA-m RNA的ce RNA调控网络。结果 共发现24个重要的核心基因可能参与了转移性恶性黑素瘤的机体免疫应答与肿瘤形成等过程(包括:RASGRP2、IKZF1、CXCR5、LTB、BLK、LINGO3、CCR6、P2RY10、RHOH、JUP、KRT14、PLA2G3、SPRR1A、KRT78、SFN、CLDN4、IL1RN、PKP3、CBLC、KRT16、TMEM79、KLK8、LYPD3、LYPD5),在转录调控因子的预测中发现GATA1、STAT1、SP1、PS...
【文章来源】:青岛大学山东省
【文章页数】:93 页
【学位级别】:博士
【部分图文】:
RNA测序数据的差异表达基因示意图
青岛大学博士学位论文83.加权基因共表达网络的构建加权基因共表达网络分析(WGCNA,Weightedgeneco-expressionnetworkanalysis)能够从复杂数据中(N多分组)快速地提取出与样本特征相关的基因共表达模块,以供后续分析。简单地说,它通过计算基因之间的表达相关性,将具有表达相关性的基因聚类到一个模块中,然后再分析模块与样本特征。本研究中,根据幂次定律和软阈值率进行了无结构化的拓扑网络构建,并按照规则构建了相邻矩阵[19]。本研究中,根据图2A所示:动态树形图分割出了六大基因模块。基于每个模块之间的相关性和重要性,独立地与其他模块之间进行了相互验证,图2B。在研究了它们的共表达情况后,我们将这些动态模块合并为三个,阈值为0.5,这证实了模块划分的可靠性,图2C。各模块间相关性的模块显著性:P=4.9e-232。作为检测模块的关键组成部分,Eigengene是检测模块表达谱变化的主要指标,其与表型的相关性有助于揭示关键的生物学功能,识别潜在的生物标志物。通过对两个主要模块的合并,发现了蓝色和黄色两个主要模块,值得进一步探索。图2差异基因的加权共表达分析A、恶性黑色素瘤基因表达的网络分析发现了不同的共表达基因模块。每一个树状图中的叶(短竖线)对应一个基因,其分支是具有高度互联关系的基因群,并用指定颜色进行了表示。B:基因模块之间的相关性,*P<0.05,**P<0.01,***P<0.001。C:模块特征聚类。这六个模块产生了两个主要的集群。D:基因模块间相关性统计学差异,P=4.9e-232。
第一章转移性黑素瘤调控机制的生物信息学分析94.针对蓝色模块与黄色模块共表达基因的本体分析及富集分析通过对蓝色和黄色模块生物学功能的探索,我们对其进行了基因本体分析进行了分析(GO)与KEGG数据库的通路分析。所有重要条目的注释信息采用颜色条表示,以突出其强化的意义,其中每个项的长度和颜色饱和度基因计数/比率成比例,调整后p值是从富集分析中获得的。在蓝色模块的本体分析中,最常见的生物学过程富集在免疫活动相关过程,包括淋巴细胞和白细胞的分化、增殖和活化以及T细胞和B细胞活化(图3A,表2),黄色模块主要富集在角质形成细胞和表皮细胞分化、角化相关,以及皮肤屏障的建立(图3B,表2)。图3蓝色和黄色模块的GO和KEGG富集分析A、B:蓝色模块与黄色模块中排名前30的本体分析:包括生物过程(BP)、细胞成分(CC)、分子功能(MF);C、D:蓝色模块与黄色模块中排名前15的KEGG分析:富集的基因数量以图中横向的柱状图长短来进行表示,显著性差异水平以图中颜色来进行表示。
本文编号:3106692
【文章来源】:青岛大学山东省
【文章页数】:93 页
【学位级别】:博士
【部分图文】:
RNA测序数据的差异表达基因示意图
青岛大学博士学位论文83.加权基因共表达网络的构建加权基因共表达网络分析(WGCNA,Weightedgeneco-expressionnetworkanalysis)能够从复杂数据中(N多分组)快速地提取出与样本特征相关的基因共表达模块,以供后续分析。简单地说,它通过计算基因之间的表达相关性,将具有表达相关性的基因聚类到一个模块中,然后再分析模块与样本特征。本研究中,根据幂次定律和软阈值率进行了无结构化的拓扑网络构建,并按照规则构建了相邻矩阵[19]。本研究中,根据图2A所示:动态树形图分割出了六大基因模块。基于每个模块之间的相关性和重要性,独立地与其他模块之间进行了相互验证,图2B。在研究了它们的共表达情况后,我们将这些动态模块合并为三个,阈值为0.5,这证实了模块划分的可靠性,图2C。各模块间相关性的模块显著性:P=4.9e-232。作为检测模块的关键组成部分,Eigengene是检测模块表达谱变化的主要指标,其与表型的相关性有助于揭示关键的生物学功能,识别潜在的生物标志物。通过对两个主要模块的合并,发现了蓝色和黄色两个主要模块,值得进一步探索。图2差异基因的加权共表达分析A、恶性黑色素瘤基因表达的网络分析发现了不同的共表达基因模块。每一个树状图中的叶(短竖线)对应一个基因,其分支是具有高度互联关系的基因群,并用指定颜色进行了表示。B:基因模块之间的相关性,*P<0.05,**P<0.01,***P<0.001。C:模块特征聚类。这六个模块产生了两个主要的集群。D:基因模块间相关性统计学差异,P=4.9e-232。
第一章转移性黑素瘤调控机制的生物信息学分析94.针对蓝色模块与黄色模块共表达基因的本体分析及富集分析通过对蓝色和黄色模块生物学功能的探索,我们对其进行了基因本体分析进行了分析(GO)与KEGG数据库的通路分析。所有重要条目的注释信息采用颜色条表示,以突出其强化的意义,其中每个项的长度和颜色饱和度基因计数/比率成比例,调整后p值是从富集分析中获得的。在蓝色模块的本体分析中,最常见的生物学过程富集在免疫活动相关过程,包括淋巴细胞和白细胞的分化、增殖和活化以及T细胞和B细胞活化(图3A,表2),黄色模块主要富集在角质形成细胞和表皮细胞分化、角化相关,以及皮肤屏障的建立(图3B,表2)。图3蓝色和黄色模块的GO和KEGG富集分析A、B:蓝色模块与黄色模块中排名前30的本体分析:包括生物过程(BP)、细胞成分(CC)、分子功能(MF);C、D:蓝色模块与黄色模块中排名前15的KEGG分析:富集的基因数量以图中横向的柱状图长短来进行表示,显著性差异水平以图中颜色来进行表示。
本文编号:3106692
本文链接:https://www.wllwen.com/shoufeilunwen/yxlbs/3106692.html
教材专著