禽流感病毒感染分子机制的系统生物学分析
发布时间:2021-02-18 16:48
流感病毒是一种RNA负链病毒,在世界各地引发季节性流感,严重时引起全球范围内的流感大流行。将动态的基因表达谱数据和静态的蛋白质相互作用网络进行整合分析的方法得到快速发展,更适合分析具体的生物医学问题。借助差异表达基因获得生物标记物方法表现不佳,而以差异通路作为生物标志物的方法则能提高稳定性和准确性。借助对生物通路之间的相互作用的分析能够从新的角度认识疾病过程。首先,我们以GSE27131人感染H1N1的样本为原始数据,对SAMVB、GSEA、主成分分析、Bioconductor、及基于通路相互作用网络筛选差异通路的方法(PIN)的准确性进行比较。其中,SAMVB,PCA和Bioconductor三种方法以统计学为基础,而另两种方法融合了更多的生物学知识。通过标准数据集方法进行比较验证,可知PIN方法的准确性最高为80.6%,而敏感性也较高,为81.3%;以交叉验证的方法进行可靠性分析,获取ROC的曲线下面积,PIN方法具有最大的ROC曲线下面积,即相比较具有最高的可靠性。随后,我们从GEO数据库中筛选出鸡感染禽流感的四组数据。分别为GSE32378,鸡感染H5N1;GSE31476,鸡...
【文章来源】:西北农林科技大学陕西省 211工程院校 985工程院校 教育部直属院校
【文章页数】:98 页
【学位级别】:硕士
【部分图文】:
SAMVB的对话框Figure2-1TheSAMVBdialogbox
该项目主要由 Dana Farber 癌症研究所生物统计组负责,始于 2001 年秋季,现已包含有 824 个安装包,功能已经包含序列分析(Sequence Analysis),RNA 序列差异表达分析(RNAseq Differential Expression),寡核苷酸阵列分析(OligonucleotideArrays),遗传变异分析(Genetic Variants),分子注释(Annotation),高能量数据分析(HighThroughput Assays)和通过序列匹配查找转录因子的结合位点等。在本文中,先采用 affy 包(Gautier, Cope et al. 2004)对基因表达数据进行预处理,对数据进行背景校正、归一化、探针值校正等处理。用limma包(Diboun, Wernisch et al. 2006)进行数据分析,使用线性模型来设计和评估差异表达的基因,识别差异分析。2.2.5 基于通路相互作用网络筛选差异通路的方法本方法相较于生物标记识别法(Biomarker identifier)(Baumgartner and Baumgartner2006, Lee and Lee 2013)和通过条件反应基因活性推断通路活性的方法(Chuang, Lee et al.2007)有更高的可靠性和准确性,后期的功能分析及文献也证明其识别致病途径的生物合理性及有效性(Liu, Liu et al. 2012)。该方法分为三步:首先,基于基因表达谱、蛋白质相互作用网络和细胞通路构建通路的相互作用网络;其次,利用特征选择识别失调的通路;第三,将失调的通路作为子网,筛选重要的蛋白质。(Liu, Liu et al. 2012)
图 2-3 文献挖掘方法得到的差异基因的维恩图2-3 The venn diagram of differentially expressed gene by literature m 结果数据集的方法来验证该方法的可靠性,可证当 q-value=0出的差异基因 67.5%都在标准数据集中,共得到 822 个差外,其余的都起下调作用。
【参考文献】:
期刊论文
[1]Role of JNK activation in apoptosis:Adouble-edged sword[J]. Jing LIU, Anning LIN* Ben May Institute for Cancer Research, The University of Chicago, 5841 S. Maryland Avenue, MC 6027, Chicago, IL 60637, USA. Cell Research. 2005(01)
本文编号:3039821
【文章来源】:西北农林科技大学陕西省 211工程院校 985工程院校 教育部直属院校
【文章页数】:98 页
【学位级别】:硕士
【部分图文】:
SAMVB的对话框Figure2-1TheSAMVBdialogbox
该项目主要由 Dana Farber 癌症研究所生物统计组负责,始于 2001 年秋季,现已包含有 824 个安装包,功能已经包含序列分析(Sequence Analysis),RNA 序列差异表达分析(RNAseq Differential Expression),寡核苷酸阵列分析(OligonucleotideArrays),遗传变异分析(Genetic Variants),分子注释(Annotation),高能量数据分析(HighThroughput Assays)和通过序列匹配查找转录因子的结合位点等。在本文中,先采用 affy 包(Gautier, Cope et al. 2004)对基因表达数据进行预处理,对数据进行背景校正、归一化、探针值校正等处理。用limma包(Diboun, Wernisch et al. 2006)进行数据分析,使用线性模型来设计和评估差异表达的基因,识别差异分析。2.2.5 基于通路相互作用网络筛选差异通路的方法本方法相较于生物标记识别法(Biomarker identifier)(Baumgartner and Baumgartner2006, Lee and Lee 2013)和通过条件反应基因活性推断通路活性的方法(Chuang, Lee et al.2007)有更高的可靠性和准确性,后期的功能分析及文献也证明其识别致病途径的生物合理性及有效性(Liu, Liu et al. 2012)。该方法分为三步:首先,基于基因表达谱、蛋白质相互作用网络和细胞通路构建通路的相互作用网络;其次,利用特征选择识别失调的通路;第三,将失调的通路作为子网,筛选重要的蛋白质。(Liu, Liu et al. 2012)
图 2-3 文献挖掘方法得到的差异基因的维恩图2-3 The venn diagram of differentially expressed gene by literature m 结果数据集的方法来验证该方法的可靠性,可证当 q-value=0出的差异基因 67.5%都在标准数据集中,共得到 822 个差外,其余的都起下调作用。
【参考文献】:
期刊论文
[1]Role of JNK activation in apoptosis:Adouble-edged sword[J]. Jing LIU, Anning LIN* Ben May Institute for Cancer Research, The University of Chicago, 5841 S. Maryland Avenue, MC 6027, Chicago, IL 60637, USA. Cell Research. 2005(01)
本文编号:3039821
本文链接:https://www.wllwen.com/yixuelunwen/dongwuyixue/3039821.html