利用GEO数据库寻找结直肠癌肝转移生物标志物
发布时间:2021-07-13 02:02
目的:胰腺癌是一种发病隐匿、预后极差的恶性消化系统肿瘤。占全部恶性肿瘤的1-2%,在我国发病率大幅度上升,死亡率上升到第5位。虽然医疗水平快速发展,癌症的诊断和治疗有了很大的进步,但早诊率低,发现时多已属晚期,而且胰腺癌手术率低,手术切除范围受限,术后复发率高达80%以上,使得胰腺癌患者的5年生存率仍处于非常低的状态。生物信息学是生命科学和计算机科学相结合形成的一门交叉学科。本研究利用生物信息学方法对高通量测序结果进行收集、分析胰腺癌发病的差异表达基因,筛选出胰腺癌关键的差异表达基因对胰腺癌发生及发展的分子机制深入研究。方法:第一步在NCBI的GEO基因表达数据库搜集并下载m RNA芯片GSE16515、GSE28735和GSE41368,使用R语言对数据进行整齐化处理并鉴定胰腺癌组织和正常组织之间的差异表达基因(DEGs),并通过火山图将三个数据集的DEGs表达情况反应出来,并用upset图对三个数据集取交集。第二步利用R语言取交集得到的DEGs进行GO(Gene Ontology)功能富集分析和KEGG(Kyoto Encyclopedia of Genes and Genomes...
【文章来源】:青岛大学山东省
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
GSE16515、GSE28735和GSE41368的PAAD和癌旁组织中所有基因表达谱的火山图
结果9结果1PAAD中的DEGs识别从GSE16515数据集中筛选出1874个DEG(包含36例患者的胰腺癌组织和16例正常组织)。此外,从GSE28735(包含45例患者的胰腺癌组织和对应匹配45例正常组织)和GSE41368数据集(包含6例患者的胰腺癌组织和与之对应的6例非癌症的胰腺组织)中分别选择了603和1837个DEGs。图1绘制了火山图,以显示每个数据集中PAAD和正常样本之间的DEG分布。使用R语言绘制UpSet图来表示三组基因表达数据集的交集,如图2所示。并且使用R语言Circos图将DEGs的所在染色体位置表示出来,如图3所示。图1GSE16515、GSE28735和GSE41368的PAAD和癌旁组织中所有基因表达谱的火山图。红色点代表高表达的mRNA,P<0.05,logFC>1;绿色点代表低表达的mRNA,P<0.05,logFC>1。黑色代表被排除的没有研究意义的mRNA。横坐标是指每个基因的调整P值的log10。纵坐标显示了肿瘤和癌旁组织之间基因表达差异倍数值。图2在GSE16515、GSE28735和GSE41368中筛选出差异表达基因,交集后共筛选出三个数据集中的391个基因。
青岛大学硕士学位论文10图3Circos图显示了DEGs在染色体上的位置。2PAAD中DEGs的功能富集分析通过GO富集分析,对各DEGs的生物学功能进行了分析,结果表明DEGs的生物过程显著富集了细胞过程和生物学功能。例如,这些基因主要富集于细胞外基质和细胞外结构组织、细胞-基质粘附、内胚层细胞分化和生成、癌症转移等过程有关,(图4A)。KEGG途径分析证明,这些基因明显富集于蛋白质消化和吸收相关的途径、癌症中的转录调控失调、肿瘤的PI3K-Akt信号通路(图4B)。这些结果提示这些基因在PAAD的发病和发展过程中具有重要意义。
【参考文献】:
期刊论文
[1]Carbohydrate antigen 19-9 for differential diagnosis of pancreatic carcinoma and chronic pancreatitis[J]. Si-Biao Su,Shan-Yu Qin,Wen Chen,Wei Luo,Hai-Xing Jiang. World Journal of Gastroenterology. 2015(14)
[2]Role of endoscopic ultrasound in the molecular diagnosis of pancreatic cancer[J]. Barbara Bournet,Marion Gayral,Jérme Torrisani,Janick Selves,Pierre Cordelier,Louis Buscail. World Journal of Gastroenterology. 2014(31)
本文编号:3281109
【文章来源】:青岛大学山东省
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
GSE16515、GSE28735和GSE41368的PAAD和癌旁组织中所有基因表达谱的火山图
结果9结果1PAAD中的DEGs识别从GSE16515数据集中筛选出1874个DEG(包含36例患者的胰腺癌组织和16例正常组织)。此外,从GSE28735(包含45例患者的胰腺癌组织和对应匹配45例正常组织)和GSE41368数据集(包含6例患者的胰腺癌组织和与之对应的6例非癌症的胰腺组织)中分别选择了603和1837个DEGs。图1绘制了火山图,以显示每个数据集中PAAD和正常样本之间的DEG分布。使用R语言绘制UpSet图来表示三组基因表达数据集的交集,如图2所示。并且使用R语言Circos图将DEGs的所在染色体位置表示出来,如图3所示。图1GSE16515、GSE28735和GSE41368的PAAD和癌旁组织中所有基因表达谱的火山图。红色点代表高表达的mRNA,P<0.05,logFC>1;绿色点代表低表达的mRNA,P<0.05,logFC>1。黑色代表被排除的没有研究意义的mRNA。横坐标是指每个基因的调整P值的log10。纵坐标显示了肿瘤和癌旁组织之间基因表达差异倍数值。图2在GSE16515、GSE28735和GSE41368中筛选出差异表达基因,交集后共筛选出三个数据集中的391个基因。
青岛大学硕士学位论文10图3Circos图显示了DEGs在染色体上的位置。2PAAD中DEGs的功能富集分析通过GO富集分析,对各DEGs的生物学功能进行了分析,结果表明DEGs的生物过程显著富集了细胞过程和生物学功能。例如,这些基因主要富集于细胞外基质和细胞外结构组织、细胞-基质粘附、内胚层细胞分化和生成、癌症转移等过程有关,(图4A)。KEGG途径分析证明,这些基因明显富集于蛋白质消化和吸收相关的途径、癌症中的转录调控失调、肿瘤的PI3K-Akt信号通路(图4B)。这些结果提示这些基因在PAAD的发病和发展过程中具有重要意义。
【参考文献】:
期刊论文
[1]Carbohydrate antigen 19-9 for differential diagnosis of pancreatic carcinoma and chronic pancreatitis[J]. Si-Biao Su,Shan-Yu Qin,Wen Chen,Wei Luo,Hai-Xing Jiang. World Journal of Gastroenterology. 2015(14)
[2]Role of endoscopic ultrasound in the molecular diagnosis of pancreatic cancer[J]. Barbara Bournet,Marion Gayral,Jérme Torrisani,Janick Selves,Pierre Cordelier,Louis Buscail. World Journal of Gastroenterology. 2014(31)
本文编号:3281109
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3281109.html