基于TCGA数据库结肠癌m-RNA差异表达基因及预后分析
发布时间:2021-09-25 02:02
目的:本研究通过对公共数据库TCGA(The Cancer Genome Atlas)的高通量数据——结肠癌m-RNA表达谱芯片进行生物信息学分析,探索结肠癌导致的基因表达水平改变,对癌组织与癌旁组织的差异表达基因进行共表达网络分析,并估计结肠癌患者的生存期,为探索结肠癌的分子机制和预后分析提供基础科学依据。方法:在公开阅览的TCGA网站(http://cancer genome.nih.gov/)下载大肠癌基因表达谱数据集,包括:(1)32例结肠癌(结肠癌组)和32例癌旁组织(癌旁组)的mRNA测序数据3级(原计数和期望最大化(RSEM)归一化RNA-seq读取计数);(2)507例结肠癌患者的m-RNA以及临床信息。经合并、整合后利用R软件质控后对32对结肠癌组和癌旁组的20531个基因进行m-RNA差异表达分析以及差异表达基因的热图制作,对差异表达基因进行共表达网络分析,对507例结肠癌患者进行生存分析。结果:在结肠癌数据集中32对结肠癌组和癌旁组的20531个基因中筛选出结肠癌中2939个基因有显著的表达差异,其中上调基因1533个,下调基因1406个。对2939个差异表达基因...
【文章来源】:山西医科大学山西省
【文章页数】:49 页
【学位级别】:硕士
【部分图文】:
CRC差异表达基因的聚类分析
山西医科大学(博)硕士学位论文12图1CRC差异表达基因的聚类分析2939个差异表达基因可有效地将32对样本分成癌组织(聚类树左半)和癌旁组织(聚类树右半)。红色即高表达基因,绿色即低表达基因。3.3CRC加权基因共表达网络构建3.3.1设定软阈值利用R软件flashClust函数绘制32对样本的聚类树形图,如图2所示。利用pickSoftThreshold函数计算不同的软阈值下某节点连接度的对数log(k)与该节点出现的概率的对数之间的相关系数log(p(k))、斜率(slope)、截断指数模型的相关系数(truncated.R.sq)、邻接系数的均值(mean.k)、中位数(median.k)和最大值(max.k)如表3所示。对log(k)与log(p(k))按照软阈值β的不同进行作图。见图3。图264例样本聚类结果
山西医科大学(博)硕士学位论文13表3筛选软阈值PowerSFT.R.sqslopetruncated.R.sqmean.k.median.k.max.k.10.02050.6890.984567.0005.63e+02791.0020.1580-1.1800.949170.0001.63e+02338.0030.5880-2.1500.96264.1005.84e+01191.0040.8150-2.3000.96828.4002.37e+01124.0050.9080-2.2800.97614.2001.07e+0187.4060.9310-2.2200.9677.7505.14e+0064.9070.9530-2.0700.9764.5702.66e+0050.2080.9630-1.9600.9812.8701.43e+0039.8090.9670-1.8700.9861.8908.07e-0132.10100.9650-1.8000.9851.3004.79e-0126.30120.9600-1.6900.9790.6791.77e-0118.30140.9650-1.6000.9810.3917.00e-0213.10160.9410-1.5500.9460.2423.06e-029.71180.9490-1.4900.9470.1591.38e-027.32200.9490-1.4600.9460.1086.44e-035.75图3软阈值的确定图3中左侧图横轴为软阈值(β值),纵轴为为不同软阈值对应的相关系数,相关系数越高,
本文编号:3408870
【文章来源】:山西医科大学山西省
【文章页数】:49 页
【学位级别】:硕士
【部分图文】:
CRC差异表达基因的聚类分析
山西医科大学(博)硕士学位论文12图1CRC差异表达基因的聚类分析2939个差异表达基因可有效地将32对样本分成癌组织(聚类树左半)和癌旁组织(聚类树右半)。红色即高表达基因,绿色即低表达基因。3.3CRC加权基因共表达网络构建3.3.1设定软阈值利用R软件flashClust函数绘制32对样本的聚类树形图,如图2所示。利用pickSoftThreshold函数计算不同的软阈值下某节点连接度的对数log(k)与该节点出现的概率的对数之间的相关系数log(p(k))、斜率(slope)、截断指数模型的相关系数(truncated.R.sq)、邻接系数的均值(mean.k)、中位数(median.k)和最大值(max.k)如表3所示。对log(k)与log(p(k))按照软阈值β的不同进行作图。见图3。图264例样本聚类结果
山西医科大学(博)硕士学位论文13表3筛选软阈值PowerSFT.R.sqslopetruncated.R.sqmean.k.median.k.max.k.10.02050.6890.984567.0005.63e+02791.0020.1580-1.1800.949170.0001.63e+02338.0030.5880-2.1500.96264.1005.84e+01191.0040.8150-2.3000.96828.4002.37e+01124.0050.9080-2.2800.97614.2001.07e+0187.4060.9310-2.2200.9677.7505.14e+0064.9070.9530-2.0700.9764.5702.66e+0050.2080.9630-1.9600.9812.8701.43e+0039.8090.9670-1.8700.9861.8908.07e-0132.10100.9650-1.8000.9851.3004.79e-0126.30120.9600-1.6900.9790.6791.77e-0118.30140.9650-1.6000.9810.3917.00e-0213.10160.9410-1.5500.9460.2423.06e-029.71180.9490-1.4900.9470.1591.38e-027.32200.9490-1.4600.9460.1086.44e-035.75图3软阈值的确定图3中左侧图横轴为软阈值(β值),纵轴为为不同软阈值对应的相关系数,相关系数越高,
本文编号:3408870
本文链接:https://www.wllwen.com/shoufeilunwen/mpalunwen/3408870.html
最近更新
教材专著