基因表达谱芯片校正批次效应算法的比较及网络分析在精神分裂症研究中的应用
发布时间:2020-11-02 07:36
基因表达谱芯片作为一种高通量的基因组研究手段,在生物医学领域应用极其广阔。然而,每年有数以千计的基于芯片的研究,其数据都被“批次效应”所混杂。批次效应是指由于芯片在不同的实验批次处理而产生的系统误差。它在以前的芯片研究中鲜有提及。虽然批次效应可以通过缜密的实验设计缓解,但除非所有样本都可以在同一批次中处理完成,否则它不可能消除。 我们首先从多个平台的实验数据中证明了了批次效应的存在,并且从多方面解析了该混杂效应对生物因素的严重影响。接下来我们从基因芯片的实验步骤入手,通过详细介绍基因芯片的实验过程,指出批次效应可能的来源。因为批次效应可以严重影响基因表达的实验结果,一系列校正批次的方法被发展出来。对目前比较流行的几种批次校正的方法,我们从方差比例,精度,准度,以及总体评价等方面进行了系统的比较,发现ComBat——一个基于经验贝叶斯的分析方法,多数指标优于其他五个算法,而且针对每个批次中含有样本量较小的数据时仍有优异的表现。我们推荐ComBat作为对不同批次的数据进行批次效应校正的最佳统计算法。另外我们还建议在比较重复样本和非重复样本之间关联的时候,有必要在探针水平进行标准化校正,从而降低非重复样本之间的被虚夸了的相关性。 我们的另一部分工作是利用基因表达谱芯片数据探寻精神分裂症的发病机制。目前已经有很多基于基因表达谱芯片的精神分裂症的研究,发现了很多的候选基因,但几乎没有基因可以通过多重校正并且从不同的实验中重复出来。这可能是因为人类大脑基因表达的异质性或因为基因表达在病人中的改变较小.我们设想基于基因基因相互作用的网络或者通路会在病人大脑中的改变会更加一致,在这个研究中,我们利用基因共表达网络来分析不同来源的5组脑组织数据。 首先我们对基因表达谱芯片数据进行了严格的质量控制,除了利用ComBat校正批次效应外,我们还通过MAS算法对探针质量进行控制,通过修改的RMA算法剔除单核苷酸多态位点对探针的影响,剔出种族差异对基因表达的影响等。之后我们通过基因共表达网络的方法构建基因网络,利用每组基因网络的特征向量,我们使用了两种不同的统计算法,校正年龄,性别,大脑pH值等变量后,挖掘是否存在某一组基因的表达水平变化与精神分裂症有强关联。 结果发现在5组数据中,金属硫蛋白家族的部分基因,MT1E,MT1F,MT1G, MTIM, MTIX, MT2A的表达量在精神分裂症患者中都有显著的提高。如此一致的结果证明金属硫蛋白家族基因确实参与了精神分裂症发病的过程,或是病因,或是症状。金属硫蛋白富含半胱氨酸,在人体中的主要作用是通过结合重金属离子调节体内微量元素,以及神经受损后的免疫反应和氧化应激等。氧化应激已经被报道与精神分裂发病机制有关。已知重金属锌(Zn)在神经发育,情绪控制和保护细胞免受损伤等方面发挥作用。另外其他重金属,铜(Cu)也推测有精神分裂症有关。我们猜测重金属的调控失调,氧化应激和组织受损等可能参与在精神分裂症的发病机理之中。 除此之外,我们还从遗传学和表观遗传学角度,分别利用eQTL的方法和DNA甲基化的数据对金属硫蛋白表达量变化进行了简要的分析。
【学位单位】:复旦大学
【学位级别】:博士
【学位年份】:2011
【中图分类】:R749.3
【文章目录】:
中文摘要
Abstract
缩写词汇
第一章 绪论
第一节 引言
第二节 基因芯片技术简介
第三节 基因芯片研究现状
第四节 基因芯片批次效应
第五节 校正批次效应算法的综述
第六节 基因芯片生物医学研究中的应用
参考文献
第二章 校正批次效应算法的比较
第一节 引言
第二节 实验数据和方法
1 实验数据
2 比较方法
第三节 实验结果
1 方差比例比较结果
2 精度比较结果
3 准度比较结果
4 综合评估比较结果
5 总结
第四节 结果讨论
第五节 结论
参考文献
第三章 基于芯片的基因共表达网络构建方法在精神分裂症中的应用
第一节 引言
1 精神分裂症
2 精神分裂症的遗传学和表观遗传学研究进展
3 精神分裂症基因表达分析研究进展
第二节 实验对象和方法
1 实验对象
2 实验方法
2.1 基因表达数据的质量控制
2.2 构建基因共表达网络
2.3 基于模块特征值的eQTL分析
2.4 DNA甲基化数据生成与处理
第三节 实验结果
1 网络构建的结果
1.1 帝国理工学院查令十字医院前额皮层基因表达的网络构建
1.2 斯坦利研究中心顶叶皮层基因表达的网络构建
1.3 斯坦利研究中心小脑的网络构建
2 不同脑区的基因表达网络的比较
CCHPC与PFCVBBN的基因网络/模块的比较'> 2.1 PFCCCHPC与PFCVBBN的基因网络/模块的比较
SMRI与CTXOldham的基因网络/模块的比较'> 2.2 PCSMRI与CTXOldham的基因网络/模块的比较
SMRI与CBOldham的基因网络/模块的比较'> 2.3 CBSMRI与CBOldham的基因网络/模块的比较
2.4 三组基因网络/模块之间的相互比较
3 基因模块的特征
3.1 与疾病状况相关的基因网络/模块
3.2 显著相关模块的基因功能
3.3 基因网络/模块基因在特定的细胞组织表达
4 显著相关模块在其他数据中的验证
5 基因模块研究与单个基因的关联分析的比较
6 eQTL方法探究遗传机制
7 DNA甲基化方法探究表观遗传机制
第四节 结果讨论
第五节 结论
参考文献
第四章 结束语
第一节 研究总结
第二节 研究展望
附录1 Pyrosequencing探针序列
附录2 基于MAS call算法筛选探针代码
附录3 基于PVCA算法计算方差比例代码
附录4 WGCNA算法构建基因共表达网络代码
附录5 模块与疾病相关的计算
论文发表情况
待发表论文
致谢
【引证文献】
本文编号:2866755
【学位单位】:复旦大学
【学位级别】:博士
【学位年份】:2011
【中图分类】:R749.3
【文章目录】:
中文摘要
Abstract
缩写词汇
第一章 绪论
第一节 引言
第二节 基因芯片技术简介
第三节 基因芯片研究现状
第四节 基因芯片批次效应
第五节 校正批次效应算法的综述
第六节 基因芯片生物医学研究中的应用
参考文献
第二章 校正批次效应算法的比较
第一节 引言
第二节 实验数据和方法
1 实验数据
2 比较方法
第三节 实验结果
1 方差比例比较结果
2 精度比较结果
3 准度比较结果
4 综合评估比较结果
5 总结
第四节 结果讨论
第五节 结论
参考文献
第三章 基于芯片的基因共表达网络构建方法在精神分裂症中的应用
第一节 引言
1 精神分裂症
2 精神分裂症的遗传学和表观遗传学研究进展
3 精神分裂症基因表达分析研究进展
第二节 实验对象和方法
1 实验对象
2 实验方法
2.1 基因表达数据的质量控制
2.2 构建基因共表达网络
2.3 基于模块特征值的eQTL分析
2.4 DNA甲基化数据生成与处理
第三节 实验结果
1 网络构建的结果
1.1 帝国理工学院查令十字医院前额皮层基因表达的网络构建
1.2 斯坦利研究中心顶叶皮层基因表达的网络构建
1.3 斯坦利研究中心小脑的网络构建
2 不同脑区的基因表达网络的比较
CCHPC与PFCVBBN的基因网络/模块的比较'> 2.1 PFCCCHPC与PFCVBBN的基因网络/模块的比较
SMRI与CTXOldham的基因网络/模块的比较'> 2.2 PCSMRI与CTXOldham的基因网络/模块的比较
SMRI与CBOldham的基因网络/模块的比较'> 2.3 CBSMRI与CBOldham的基因网络/模块的比较
2.4 三组基因网络/模块之间的相互比较
3 基因模块的特征
3.1 与疾病状况相关的基因网络/模块
3.2 显著相关模块的基因功能
3.3 基因网络/模块基因在特定的细胞组织表达
4 显著相关模块在其他数据中的验证
5 基因模块研究与单个基因的关联分析的比较
6 eQTL方法探究遗传机制
7 DNA甲基化方法探究表观遗传机制
第四节 结果讨论
第五节 结论
参考文献
第四章 结束语
第一节 研究总结
第二节 研究展望
附录1 Pyrosequencing探针序列
附录2 基于MAS call算法筛选探针代码
附录3 基于PVCA算法计算方差比例代码
附录4 WGCNA算法构建基因共表达网络代码
附录5 模块与疾病相关的计算
论文发表情况
待发表论文
致谢
【引证文献】
相关期刊论文 前1条
1 宋长新;雷萍;王婷;;基于WGCNA算法的基因共表达网络构建理论及其R软件实现[J];基因组学与应用生物学;2013年01期
本文编号:2866755
本文链接:https://www.wllwen.com/yixuelunwen/jsb/2866755.html
最近更新
教材专著