拟南芥免疫相关基因网络的构建及多尺度的比较分析

发布时间:2017-05-19 04:07

  本文关键词:拟南芥免疫相关基因网络的构建及多尺度的比较分析,由笔耕文化传播整理发布。


【摘要】:细胞中复杂的基因互作可以通过网络生物学的理论加以明确表述。在有效的植物免疫响应的背后是众多免疫相关基因之间的精密协作。因此网络生物学的手段可以用于详细地解析植物中不同类型的免疫响应之间的异同之处。病原体相关分子模式激发的免疫(PTI)和效应蛋白激发的免疫(ETI)是植物对抗病原体入侵的两种主要的免疫响应类型。但是在全基因组的尺度,关于基因网络是如何组织并导致PTI和ETI之间的定量差异仍然尚未明确。作者结合先进的机器学习算法和模块化的网络分析,试图在三个网络尺度上系统地刻画拟南芥中PTI和ETI的组织原理。在单个网络节点或者边的水平,作者依据每个基因和基因互作在区分植物免疫响应和正常生长状态上的能力,对基因网络中的基因和基因互作进行排序,并成功地鉴定了多个与PTI和ETI相关的植物免疫相关基因。网络拓扑分析揭示,排名较高的基因互作倾向于连接着不同的网络模块。在子网络的水平,作者鉴定了一个PTI和ETI间共享的子网络,其中包括了1,156个基因及其之间的1,289条基因互作。该子网络中富集了连接网络模块的基因互作,同时也是病原体效应蛋白攻击的热区。推断此子网络可能代表了植物免疫基因网络中的一个核心组分,介导着多个生物学过程在免疫响应中的协同进行,促进植物由正常的发育状态向防御状态转变。最后,为了从全局的网络架构解释PTI和ETI之间的定量差异,作者为PTI和ETl分别构建了模块化的网络模型。结果表明,在ETI中防御模块以一种相对更加独立的结构组织在一起,这为ETI对遗传突变和效应蛋白攻击表现出来的较强的承受能力提供了一种解释。以上对PTI和ETI的多尺度比较分析为理解植物免疫提供了一种系统生物学的视角,同时这些结果强调了多个网络模块之间的协同工作对于建立稳健的免疫响应的重要性。 除了植物的免疫系统,植物和病原体之间的“军备竞赛”同样深远地影响了病原体的感染策略。作为革兰氏阴性细菌最重要的毒力因子,三型效应蛋白(T3SE)通过抑制植物的免疫响应,在植物和病原体的互作中扮演了至关重要的角色。但是T3SE的进化速率较快,这使得传统的生物信息学方法,如序列相似性搜索,难以从新测序的病原体基因组中鉴定T3SE。在本文工作中,通过结合基于序列谱的氨基酸对信息以及机器学习算法,作者开发了一个准确的T3SE预测器BEAN(Bacterial effectorANalyzer)。BEAN的创新之处是使用了基于隐马尔科夫模型的序列搜索方法(即HHblits)检测T3SE的同源序列并构建序列谱,进而从N端序列提取k-spaced的氨基酸对组成信息(HH-CKSAAP)。这一编码策略放大了T3SE中弱保守的氨基酸残基信息。结果显示,BEAN的灵敏度和特异性分别达到了78%和96%,并且在独立测试集上比已经报道的4种T3SE预测器有更好的表现。在植物病原体基因组上开展的T3SE鉴定测试也证实了BEAN在全基因组范围内应用的有效性。为了进一步刻画三型分泌信号的组成,作者对具有较强预测能力的氨基酸对开展了进化和位置偏好性分析。分析结果暗示保守的序列motif可能是三型分泌信号的重要组成。综上,本文工作显示了网络生物学和机器学习可以作为强大的分析框架和工具,加深我们对植物与病原体的互作的认识。此外本文工作中使用的研究手段也可以很好地适用于其它重要生物学问题的研究。
【关键词】:植物免疫 三型效应蛋白 网络生物学 机器学习
【学位授予单位】:中国农业大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:Q943.2
【目录】:
  • 摘要4-5
  • Abstract5-7
  • ~.略词列表7-9
  • 目录9-11
  • 第一章 绪论11-33
  • 1.1 网络生物学概述11-22
  • 1.1.1 分子网络的基本类型11-16
  • 1.1.2 分子网络的结构层次16-19
  • 1.1.3 基于分子网络的整合分析19-22
  • 1.2 植物免疫简介22-30
  • 1.2.1 植物免疫系统的基本构成22-25
  • 1.2.2 植物免疫响应的调控基因和有关信号通路研究进展25-28
  • 1.2.3 病原细菌三型效应蛋白28-30
  • 1.3 网络生物学在植物免疫研究中的应用30-31
  • 1.4 本文工作的提出与研究目的31-33
  • 第二章 病原体相关分子模式激发的免疫(PTI)和效应蛋白激发的免疫(ETI)之间的比较分析33-63
  • 2.1 引言33-34
  • 2.2 材料与方法34-39
  • 2.2.1 数据集的收集和整理34
  • 2.2.2 基因网络的构建与质量控制34-36
  • 2.2.3 网络引导的随机森林算法(NGF)36-37
  • 2.2.4 决策规则的提取和分析37
  • 2.2.5 网络模块的鉴定37-38
  • 2.2.6 基于NGF的基因集富集分析38
  • 2.2.7 Closeness centrality的计算38-39
  • 2.2.8 网络可视化39
  • 2.3 结果与分析39-59
  • 2.3.1 构建一个整合的拟南芥基因网络39-41
  • 2.3.2 使用网络引导的随机森林算法鉴定PTI与ETI的网络组分41-49
  • 2.3.3 PTI与ETI共享的子网络是病原体效应蛋白攻击的热区49-50
  • 2.3.4 模块化的免疫相关基因网络模型50-54
  • 2.3.5 模块M63提示染色质的动态性可能在ETI有着潜在的作用54-57
  • 2.3.6 一个在线的网络资源用于交互式的探索模块化的网络模型57-59
  • 2.4 讨论59-61
  • 2.4.1 NGF能够有效的结合基因网络和基因表达的信息识别免疫相关基因59-60
  • 2.4.2 一个PTI和ETI共享的子网络60
  • 2.4.3 防御模块间相对独立的组织方式可能是ETI区别于PTI的一个重要方面60-61
  • 2.4.4 局限性和未来的方向61
  • 2.5 小结61-63
  • 第三章 病原细菌三型效应蛋白识别算法的开发63-82
  • 3.1 引言63-64
  • 3.2 材料和方法64-67
  • 3.2.1 数据集的构建64
  • 3.2.2 同源序列搜索与序列谱构建64-65
  • 3.2.3 从序列谱中提取k-spaced氨基酸对作为特征向量65
  • 3.2.4 训练SVM模型并提取氨基酸对的权重65-66
  • 3.2.5 算法评价66-67
  • 3.2.6 氨基酸对的进化保守性分析67
  • 3.2.7 氨基酸对的位置分布分析67
  • 3.3 结果与分析67-80
  • 3.3.1 BEAN的预测性能67-71
  • 3.3.2 有效特征分析71-74
  • 3.3.3 BEAN与其它四种已有的基于机器学习的T3SE预测算法的性能比较74-76
  • 3.3.4 应用BEAN在全基因组范围内鉴定青枯病病菌的T3SE76-78
  • 3.3.5 BEAN的网络服务器78-80
  • 3.4 讨论80-81
  • 3.4.1 三型分泌信号与弱保守的motif80
  • 3.4.2 三型分泌信号的组成80-81
  • 3.5 小结81-82
  • 第四章 结论与展望82-84
  • 4.1 结论82-83
  • 4.2 展望83-84
  • 参考文献84-94
  • 致谢94-95
  • 附录95-105
  • 作者简历105

【共引文献】

中国期刊全文数据库 前10条

1 蔡坤琪;;基于相关鉴别分析和随机森林的人脸识别方法[J];安徽电子信息职业技术学院学报;2012年01期

2 李飞;高小榕;高上凯;;基于随机森林算法的高维脑电特征优选[J];北京生物医学工程;2007年04期

3 陈建新;西广成;王伟;赵慧辉;陈静;;数据挖掘分类算法在冠心病临床应用的比较[J];北京生物医学工程;2008年03期

4 熊文;王枞;;改进粒子群与支持向量机混合的特征变换[J];北京邮电大学学报;2009年06期

5 蔡金锭;鄢仁武;;基于小波分析与随机森林算法的电力电子电路故障诊断[J];电力科学与技术学报;2011年02期

6 胥海威;何宽;;改进随机决策树群算法在监督分类中的应用[J];地理与地理信息科学;2010年06期

7 张郴;张捷;;中国入境旅游需求预测的神经网络集成模型研究[J];地理科学;2011年10期

8 马昕;郭静;孙啸;;蛋白质中RNA-结合残基预测的随机森林模型[J];东南大学学报(自然科学版);2012年01期

9 胡锋;邢洁清;;一种基于小波变换与随机森林的人脸识别方法[J];电脑知识与技术;2011年16期

10 叶圣永;王晓茹;刘志刚;钱清泉;;电力系统暂态稳定评估组合模型的比较[J];电网技术;2008年23期

中国重要会议论文全文数据库 前10条

1 贾少春;胡秀珍;;A Method of Predicting theβ-hairpin Motifs in Proteins[A];第四届全国生物信息学与系统生物学学术大会论文集[C];2010年

2 李胜朋;王洪礼;冯剑丰;;基于不连续回归树的最大李雅谱诺夫指数计算方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年

3 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

4 张红梅;;基于粗糙集特征约简的SVM集成入侵检测模型[A];2009中国控制与决策会议论文集(3)[C];2009年

5 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年

6 曹东升;许青松;梁逸曾;;Computer-Aided Prediction of Toxicity with Substructure Pattern and Random Forest[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年

7 李梦龙;;Systematically analyze and select key features to microRNA precursors identification based on random forests[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年

8 秦文丽;李益洲;李娟;余乐正;郭延芝;李梦龙;;基于蛋白质序列信息的信号肽上有害非同义单核苷酸多态性的预测[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年

9 冯飞翔;冯辅周;江鹏程;刘菁;刘建敏;;随机森林和k-近邻法在某型坦克变速箱状态识别中的应用[A];第八届全国转子动力学学术讨论会论文集[C];2008年

10 饶国强;冯辅周;江鹏程;靳莹;范结绪;;模糊识别在变速箱状态识别中的应用研究[A];2008年全国振动工程及应用学术会议暨第十一届全国设备故障诊断学术会议论文集[C];2008年

中国博士学位论文全文数据库 前10条

1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年

2 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年

3 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年

4 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年

5 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年

6 王树云;基于Bayes方法和图限制下正规化方法的变量选择问题及其在基因组数据中的应用[D];山东大学;2010年

7 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年

8 田健;计算机辅助分子设计提高蛋白质热稳定性的研究[D];中国农业科学院;2011年

9 戴俊程;基于全基因组关联研究的中国女性乳腺癌风险预测模型研究[D];南京医科大学;2011年

10 王清;集成学习中若干关键问题的研究[D];复旦大学;2011年

中国硕士学位论文全文数据库 前10条

1 马冉冉;集成学习算法研究[D];山东科技大学;2010年

2 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年

3 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年

4 李红;数据挖掘中特征选择与聚类算法研究[D];大连理工大学;2010年

5 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年

6 朱新荣;径向基函数神经网络集成算法的研究及应用[D];大连理工大学;2010年

7 严康;基于支持向量机的特征选择算法研究[D];大连理工大学;2010年

8 唐晓敏;基于霍夫变换及条件概率模型的多目标检测[D];大连理工大学;2010年

9 王若飞;基于机器学习的蛋白质折叠预测算法研究[D];湘潭大学;2010年

10 杨向军;Web spam检测系统的设计和实现[D];华南理工大学;2010年


  本文关键词:拟南芥免疫相关基因网络的构建及多尺度的比较分析,由笔耕文化传播整理发布。



本文编号:377719

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/377719.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户467c7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com