结核病潜在关键基因的生物信息学分析
发布时间:2021-08-01 08:18
目的通过生物信息学方法筛选结核病的关键基因,为结核病的防治及科研提供新的研究方向和思路。方法分析GEO(Gene Expression Omnibus)数据库的两个系列微阵列数据集(GSE19443和GSE19444),使用在线工具GEO2R来获取结核病患者和健康对照组间的差异表达基因(differentially expressed genes,DEGs)。然后对差异表达基因进行基因本体论分析(Gene Ontology,GO)和京都基因与基因组百科全书相关富集通路分析(Kyoto Encyclopedia of Genes and Genomes,KEGG),通过构建蛋白-蛋白互作(Protein-protein interaction,PPI)网络来筛选出在结核病的发生发展中起着较为重要的关键基因及其潜在的病理机制,使用Cytoscape软件的Genemania插件进一步重预测差异基因的潜在的功能。结果经过GEO2R分析后,一共获得143个与结核病相关的差异表达基因,其中包含48个表达上调基因和50个表达下调基因;GO和KEGG分析表明,上调的差异表达基因与癌症和系统发育相关,而...
【文章来源】:中国病原生物学杂志. 2020,15(06)北大核心CSCD
【文章页数】:7 页
【部分图文】:
GeneMania重预测关键基因的蛋白互作网络
为了搜索差异表达基因的功能,使用DAVID数据库分析差异表达基因将会在GO和KEGG哪些方面上富集,其中GO分析为生物过程(biological process, BP)、细胞组分(cell component, CC)和分子功能(molecular function, MF)。将所有上调和下调的差异表达基因分别上传到DAVID数据库并进行分析,在GO结果中,上调的差异表达基因在生物过程、细胞组分和分子功能上0得到富集,其中生物过程包括肾单位发育(nephron development)、肾脏发育(kidney development)、肾脏系统发育(renal system development)、泌尿生殖系统发育(urogenital system development)以及肾单位上皮发育(nephron epithelium development)等,而细胞组分仅包括细胞顶端部分(apical part of cell),分子功能仅在结构分子活性(structural molecule activity)和转录辅因子活性(transcription cofactor activity)方面差异有统计学意义(P<0.05)。下调基因在生物过程和分子功能上得到富集,且主要富集在细胞组分上,生物过程包括先天免疫反应(transcription cofactor activity)、防御反应(defense response)、对干扰素-γ的反应(response to interferon-gamma)、对细胞因子的反应(response to cytokine)、免疫反应(immune response)等;分子功能包括寡腺苷酸合成酶活性(oligoadenylate synthetase activity)、腺苷酰转移酶活性(adenylyltransferase activity)、双链RNA结合(double-stranded RNA binding)、三磷酸鸟苷结合(GTP binding)等。细胞组分的富集两组比较差异无统计学意义(P>0.05),因此不认为下调的差异基因在细胞组分上富集(表2)。在KEGG结果中,表达上调的差异基因富集在与癌症、粘着斑、Ras信号通路及阿米巴病等相关的通路上,而下调的5个差异基因(SOCS3、OAS3、OAS1、OAS2、STAT1)同时富集在相同的3条与感染性疾病相关的生物通路上(表3)。表2 差异表达基因的GO分析Table 2 GO analysis of differentially expressed genes 基因分类Gene category GO分类GO category ID及名称ID and names 基因数Count of genes P值P value 基因Gene 上调 BP GO:0072006~nephron development 5 2.97E-04 MAGI2, LAMA5, HOXA11, TEK, CTNNB1 BP GO:0001822~kidney development 6 3.76E-04 MAGI2, LAMA5, HOXA11, TEK, ID3, CTNNB1 BP GO:0072001~renal system development 6 4.91E-04 MAGI2, LAMA5, HOXA11, TEK, ID3, CTNNB1 BP GO:0001655~urogenital system development 6 8.56E-04 MAGI2, LAMA5, HOXA11, TEK, ID3, CTNNB1 BP GO:0072009~nephron epithelium development 4 0.00221307 MAGI2, LAMA5, HOXA11, CTNNB1 CC GO:0045177~apical part of cell 4 0.044370181 HPN, SORBS2, TEK, CTNNB1 MF GO:0005198~structural molecule activity 6 0.045208057 RPS26, MAGI2, LAMA5, SORBS2, RPS26P11, COL4A5 MF GO:0003712~transcription cofactor activity 5 0.049206991 RBPMS, USP21, RUNX1T1, ID3, CTNNB1 下调 BP GO:0045087~innate immune response 17 4.48E-11 GBP5, SOCS3, OAS3, OAS1, OAS2, SLAMF7, STAT1, C1QC, AIM2,GCH1, C1QB, IFI27, PARP9, FCGR1B, XAF1, SSC5D, GBP1 BP GO:0006952~defense response 19 4.50E-09 GBP5, SOCS3, OAS3, OAS1, IFI44L, OAS2, SLAMF7, STAT1, C1QC,SP140, AIM2, GCH1, C1QB, IFI27, PARP9, FCGR1B, XAF1, SSC5D, GBP1 BP GO:0034341~response to interferon-gamma 9 4.68E-09 GBP5, SOCS3, FCGR1B, OAS3, OAS1, OAS2, STAT1, GBP1, GCH1 BP GO:0034097~response to cytokine 14 3.43E-08 IFI27, GBP5, PARP9, SOCS3, FCGR1B, OAS3, OAS1, OAS2, XAF1,STAT1, GAS6, AIM2, GBP1, GCH1 BP GO:0006955~immune response 18 4.74E-08 GBP5, SOCS3, OAS3, OAS1, OAS2, SLAMF7, STAT1, C1QC, AIM2,GAS6, GCH1, C1QB, IFI27, PARP9, FCGR1B, XAF1, SSC5D, GBP1 MF GO:0001730~2"-5"-oligoadenylate synthetase activity 3 3.51E-05 OAS3, OAS1, OAS2 MF GO:0070566~adenylyltransferase activity 3 0.001566 OAS3, OAS1, OAS2 MF GO:0003725~double-stranded RNA binding 3 0.011076 OAS3, OAS1, OAS2 MF GO:0005525~GTP binding 5 0.014158 GBP5, IFI44L, GBP4, GBP1, GCH1 MF GO:0032561~guanyl ribonucleotide binding 5 0.016904031 GBP5, IFI44L, GBP4, GBP1, GCH1 注:BP表示生物过程;CC表示细胞组分;MF表示分子功能。Notes: BP, biological process; cc, cell component; MF, molecular function.
将所有的差异表达基因上传到STRING数据库并获得PPI网络数据,将PPI网络数据导进Cytoscape软件进一步分析PPI网络图潜在的生物信息(图2)。经过分析后确定连接度前十的基因,分别是信号转导和转录激活因子1(STAT1)(连接度为35分)、鸟苷酸结合蛋白5(GBP5,26分)、2"-5"-寡腺苷酸合成酶1(OAS1,25分)、连环蛋白β1(CTNNB1,25分)、鸟苷酸结合蛋白1(GBP1,25分)、2"-5"-寡腺苷酸合成酶2(OAS2, 23分)、poly(ADP-ribose)聚合酶家族成员9(PARP9,21分)、干扰素诱导蛋白44类似物(IFI44, 20分)、XIAP相关因子1(XAF1,19分)、细胞因子信号传导抑制因子3(SOCS3,19分)。由于鸟苷酸结合蛋白4(GBP4 ,19分)和胸部上皮间质相互作用蛋白1(EPSTI1,19分)的连接度与XAF1相同,因此共选出12个与结核病相关的关键基因。除鸟苷酸结合蛋白1(GBP1)外,选出的关键基因在结核病组中表达均下调(表4)。表4 关键基因Table 4 Key genes 基因Genes 基因描述Genes description 连接度(分)Connective degree 上调/下调Up/Down STAT1 signal transducer and activator of transcription 1 35 下调 GBP5 guanylate binding protein 5 26 下调 OAS1 2"-5"-oligoadenylate synthetase 1 25 下调 CTNNB1 catenin beta 1 25 下调 GBP1 guanylate binding protein 1 25 上调 OAS2 2"-5"-oligoadenylate synthetase 2 23 下调 PARP9 poly(ADP-ribose) polymerase family member 9 21 下调 IFI44 interferon induced protein 44 like 20 下调 XAF1 XIAP associated factor 1 19 下调 SOCS3 suppressor of cytokine signaling 3 19 下调 GBP4 guanylate binding protein 4 19 下调 EPSTI1 epithelial stromal interaction 1 (breast) 19 下调
本文编号:3315155
【文章来源】:中国病原生物学杂志. 2020,15(06)北大核心CSCD
【文章页数】:7 页
【部分图文】:
GeneMania重预测关键基因的蛋白互作网络
为了搜索差异表达基因的功能,使用DAVID数据库分析差异表达基因将会在GO和KEGG哪些方面上富集,其中GO分析为生物过程(biological process, BP)、细胞组分(cell component, CC)和分子功能(molecular function, MF)。将所有上调和下调的差异表达基因分别上传到DAVID数据库并进行分析,在GO结果中,上调的差异表达基因在生物过程、细胞组分和分子功能上0得到富集,其中生物过程包括肾单位发育(nephron development)、肾脏发育(kidney development)、肾脏系统发育(renal system development)、泌尿生殖系统发育(urogenital system development)以及肾单位上皮发育(nephron epithelium development)等,而细胞组分仅包括细胞顶端部分(apical part of cell),分子功能仅在结构分子活性(structural molecule activity)和转录辅因子活性(transcription cofactor activity)方面差异有统计学意义(P<0.05)。下调基因在生物过程和分子功能上得到富集,且主要富集在细胞组分上,生物过程包括先天免疫反应(transcription cofactor activity)、防御反应(defense response)、对干扰素-γ的反应(response to interferon-gamma)、对细胞因子的反应(response to cytokine)、免疫反应(immune response)等;分子功能包括寡腺苷酸合成酶活性(oligoadenylate synthetase activity)、腺苷酰转移酶活性(adenylyltransferase activity)、双链RNA结合(double-stranded RNA binding)、三磷酸鸟苷结合(GTP binding)等。细胞组分的富集两组比较差异无统计学意义(P>0.05),因此不认为下调的差异基因在细胞组分上富集(表2)。在KEGG结果中,表达上调的差异基因富集在与癌症、粘着斑、Ras信号通路及阿米巴病等相关的通路上,而下调的5个差异基因(SOCS3、OAS3、OAS1、OAS2、STAT1)同时富集在相同的3条与感染性疾病相关的生物通路上(表3)。表2 差异表达基因的GO分析Table 2 GO analysis of differentially expressed genes 基因分类Gene category GO分类GO category ID及名称ID and names 基因数Count of genes P值P value 基因Gene 上调 BP GO:0072006~nephron development 5 2.97E-04 MAGI2, LAMA5, HOXA11, TEK, CTNNB1 BP GO:0001822~kidney development 6 3.76E-04 MAGI2, LAMA5, HOXA11, TEK, ID3, CTNNB1 BP GO:0072001~renal system development 6 4.91E-04 MAGI2, LAMA5, HOXA11, TEK, ID3, CTNNB1 BP GO:0001655~urogenital system development 6 8.56E-04 MAGI2, LAMA5, HOXA11, TEK, ID3, CTNNB1 BP GO:0072009~nephron epithelium development 4 0.00221307 MAGI2, LAMA5, HOXA11, CTNNB1 CC GO:0045177~apical part of cell 4 0.044370181 HPN, SORBS2, TEK, CTNNB1 MF GO:0005198~structural molecule activity 6 0.045208057 RPS26, MAGI2, LAMA5, SORBS2, RPS26P11, COL4A5 MF GO:0003712~transcription cofactor activity 5 0.049206991 RBPMS, USP21, RUNX1T1, ID3, CTNNB1 下调 BP GO:0045087~innate immune response 17 4.48E-11 GBP5, SOCS3, OAS3, OAS1, OAS2, SLAMF7, STAT1, C1QC, AIM2,GCH1, C1QB, IFI27, PARP9, FCGR1B, XAF1, SSC5D, GBP1 BP GO:0006952~defense response 19 4.50E-09 GBP5, SOCS3, OAS3, OAS1, IFI44L, OAS2, SLAMF7, STAT1, C1QC,SP140, AIM2, GCH1, C1QB, IFI27, PARP9, FCGR1B, XAF1, SSC5D, GBP1 BP GO:0034341~response to interferon-gamma 9 4.68E-09 GBP5, SOCS3, FCGR1B, OAS3, OAS1, OAS2, STAT1, GBP1, GCH1 BP GO:0034097~response to cytokine 14 3.43E-08 IFI27, GBP5, PARP9, SOCS3, FCGR1B, OAS3, OAS1, OAS2, XAF1,STAT1, GAS6, AIM2, GBP1, GCH1 BP GO:0006955~immune response 18 4.74E-08 GBP5, SOCS3, OAS3, OAS1, OAS2, SLAMF7, STAT1, C1QC, AIM2,GAS6, GCH1, C1QB, IFI27, PARP9, FCGR1B, XAF1, SSC5D, GBP1 MF GO:0001730~2"-5"-oligoadenylate synthetase activity 3 3.51E-05 OAS3, OAS1, OAS2 MF GO:0070566~adenylyltransferase activity 3 0.001566 OAS3, OAS1, OAS2 MF GO:0003725~double-stranded RNA binding 3 0.011076 OAS3, OAS1, OAS2 MF GO:0005525~GTP binding 5 0.014158 GBP5, IFI44L, GBP4, GBP1, GCH1 MF GO:0032561~guanyl ribonucleotide binding 5 0.016904031 GBP5, IFI44L, GBP4, GBP1, GCH1 注:BP表示生物过程;CC表示细胞组分;MF表示分子功能。Notes: BP, biological process; cc, cell component; MF, molecular function.
将所有的差异表达基因上传到STRING数据库并获得PPI网络数据,将PPI网络数据导进Cytoscape软件进一步分析PPI网络图潜在的生物信息(图2)。经过分析后确定连接度前十的基因,分别是信号转导和转录激活因子1(STAT1)(连接度为35分)、鸟苷酸结合蛋白5(GBP5,26分)、2"-5"-寡腺苷酸合成酶1(OAS1,25分)、连环蛋白β1(CTNNB1,25分)、鸟苷酸结合蛋白1(GBP1,25分)、2"-5"-寡腺苷酸合成酶2(OAS2, 23分)、poly(ADP-ribose)聚合酶家族成员9(PARP9,21分)、干扰素诱导蛋白44类似物(IFI44, 20分)、XIAP相关因子1(XAF1,19分)、细胞因子信号传导抑制因子3(SOCS3,19分)。由于鸟苷酸结合蛋白4(GBP4 ,19分)和胸部上皮间质相互作用蛋白1(EPSTI1,19分)的连接度与XAF1相同,因此共选出12个与结核病相关的关键基因。除鸟苷酸结合蛋白1(GBP1)外,选出的关键基因在结核病组中表达均下调(表4)。表4 关键基因Table 4 Key genes 基因Genes 基因描述Genes description 连接度(分)Connective degree 上调/下调Up/Down STAT1 signal transducer and activator of transcription 1 35 下调 GBP5 guanylate binding protein 5 26 下调 OAS1 2"-5"-oligoadenylate synthetase 1 25 下调 CTNNB1 catenin beta 1 25 下调 GBP1 guanylate binding protein 1 25 上调 OAS2 2"-5"-oligoadenylate synthetase 2 23 下调 PARP9 poly(ADP-ribose) polymerase family member 9 21 下调 IFI44 interferon induced protein 44 like 20 下调 XAF1 XIAP associated factor 1 19 下调 SOCS3 suppressor of cytokine signaling 3 19 下调 GBP4 guanylate binding protein 4 19 下调 EPSTI1 epithelial stromal interaction 1 (breast) 19 下调
本文编号:3315155
本文链接:https://www.wllwen.com/yixuelunwen/chuanranbingxuelunwen/3315155.html
最近更新
教材专著