基于生物学通路的差异表达基因检测
发布时间:2017-07-21 01:12
本文关键词:基于生物学通路的差异表达基因检测
更多相关文章: 差异表达 通路 RT~2统计量 B-H过程 ROC曲线
【摘要】:生命科学正在经历大数据的时代,数据库的大小正以指数形式增加.目前,数据库包含了上百万的转录组学数据和数以千计的蛋白质组学数据.差异表达分析,即比较不同条件下的基因表达水平,现已成为寻找生物标记,目标靶向和候选基因的主要工具.传统的基因表达数据分析是以单个基因为单位,这忽略了基因间复杂的相关性和协同机制.忽视潜在的生物学信息不仅使分析的功效降低,而且不易发现隐藏的重要生物学信号.因此,基因集分析方法更加适用于高维的基因数据. 在本篇论文中,我们研究的是两组与疾病相关的差异通路检测方法:传统的Hotelling's T2检验、对角线Hotelling's T2检验和修正的Hotelling's T2检验.传统的Hotelling's T2统计量要求样本数大于变量数.然而,对于基因集分析,样本数普遍小于基因个数.结果导致Hotelling's T2统计量的值不唯一.对角线的Hotelling'sT2统计量忽视协方差阵S的非对角线元素虽然能够解决协方差阵的奇异问题,但这种方法忽略了基因集内部基因的相关性.在这篇论文里,我提出了一种修正的Hotelling's T2统计量,记为RT2统计量.它弥补了上述两种方法的不足.在模拟实验中,以ROC曲线作为评价标准,比较本文改进的方法与Hotelling's T2检验法和对角线Hotelling's T2检验法在检验差异通路能力方面的优劣.通过模拟实验证实本文的方法对差异通路的识别能力更强.
【关键词】:差异表达 通路 RT~2统计量 B-H过程 ROC曲线
【学位授予单位】:黑龙江大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:Q811.4
【目录】:
- 中文摘要3-4
- Abstract4-5
- 目录5-7
- 第1章 绪论7-11
- 1.1 研究的背景及其意义7-8
- 1.2 国内外研究概况8-9
- 1.3 本文的主要内容9-11
- 第2章 差异基因检测的方法11-17
- 2.1 多重假设检验中错误率的控制11
- 2.2 单基因检测方法11-13
- 2.2.1 t检验法12-13
- 2.2.2 SAM法13
- 2.2.3 单基因检测的缺点13
- 2.3 基因集检测方法13-15
- 2.3.1 传统的Hotelling's T~2检验法14-15
- 2.3.2 对角线Hotelling's T~2检验法15
- 2.4 修正的Hotelling's T~2检验法15-17
- 第3章 检验方法的评价17-21
- 3.1 灵敏度和特异性17-19
- 3.1.1 灵敏度和特异性的概念17-18
- 3.1.2 灵敏度和特异性的应用18-19
- 3.2 ROC曲线19-21
- 3.2.1 ROC曲线概述19
- 3.2.2 ROC曲线作用19-21
- 第4章 模拟研究21-34
- 4.1 数据模拟21-23
- 4.1.1 模拟实验介绍21-22
- 4.1.2 模拟过程22-23
- 4.2 模拟结果和分析23-34
- 结论34-35
- 参考文献35-41
- 致谢41-42
- 攻读学位期间发表的学术论文42-43
【共引文献】
中国硕士学位论文全文数据库 前1条
1 刘文文;bHLH122提高植物抗逆能力的分子机制初探[D];中国农业科学院;2013年
,本文编号:570810
本文链接:https://www.wllwen.com/yixuelunwen/swyx/570810.html