基于结构域信息的蛋白质复合物识别与疾病基因预测
本文选题:结构域相互作用网络 切入点:头脑风暴策略 出处:《华中师范大学》2016年硕士论文
【摘要】:蛋白质及其相互作用在各种生命活动中起着至关重要的作用。复杂的蛋白质相互作用网络中包含着许多具有研究价值的信息,亟待有效的方法对其进行深入分析与挖掘。结构域作为蛋白质中重要的空间结构层次,提供了不可或缺的重要生物信息。本文提出了一种基于智能优化思想的蛋白质复合物识别算法,并且结合蛋白质结构域相互作用网络对疾病基因进行了预测。针对蛋白质相互作用网络(PPI)拓扑结构的局限性与偏好性,本文结合结构域和拓扑结构信息对PPI网络进行了重新构建。通过与基于拓扑结构的PPI网络和结合GO注释构建的PPI网络进行比较以验证添加结构域信息后的混合结构的PPI网络有效性。基于群智能优化中的头脑风暴策略,提出了一种蛋白质复合物识别算法——IPC-BSS(Identifying Protein Complexes based on Brain Storming Strategy)。IPC-BSS算法模仿人类头脑风暴的讨论过程,设计了使蛋白质节点可以在不同蛋白质复合物之间迁移,以及相互之间联系紧密的蛋白质复合物可以进行融合的两种更新策略,以得到更优的蛋白质复合物。该算法有效克服了在早期被错误划分的蛋白质节点难以纠正的缺陷。实验结果表明,与其它经典蛋白质复合物识别算法相比,IPC-BSS算法有较好的F-measure值,能有效识别具有生物学意义的蛋白质复合物,并能完全识别一些规模较大的蛋白质复合物。蛋白质结构域之间会存在一定地联系,形成结构域相互作用网络,它从空间结构层次上解释了蛋白质之间的相互作用,本文将结构域相互网络作为蛋白质相互作用网络与疾病相似性网络的桥梁,融合多层异构网络的信息,提出了非平衡三随机游走算法——UThrRW(Unbalanced Three Random Walk)。UThrRW算法不仅挖掘了网络内的信息,同时也利用了网络之间隐藏的生物信息,结构域相互作用网络会增强蛋白质相互作用与疾病相似性网络间的联系,从而提高算法的预测效果。实验结果表明,UThrRW算法预测疾病基因的效果优于经典的RWR算法、BiRW_b1算法和UBiRW算法。
[Abstract]:Proteins and their interactions play a vital role in a variety of life activities. Complex protein interaction networks contain a lot of valuable information. It needs to be analyzed and excavated by effective methods. Domain is an important spatial structure level in protein. This paper presents a protein complex recognition algorithm based on intelligent optimization. The disease gene was predicted by protein domain interaction network. The limitation and preference of PPI topological structure of protein interaction network were analyzed. This paper reconstructs PPI network with domain and topology information, and compares it with PPI network based on topology structure and PPI network based on go annotation to verify the mixed junction after adding domain information. Based on brainstorming strategy in swarm intelligence optimization, In this paper, a protein complex recognition algorithm, IPC-BSS identification Protein Complexes based on Brain Storming Strategy).IPC-BSS algorithm, is proposed to mimic the human brainstorming process, and the protein nodes are designed to migrate between different protein complexes. And two strategies for fusion of closely connected protein complexes, In order to obtain a better protein complex, the algorithm overcomes the defects of the protein nodes that were misdivided in the early stage. The experimental results show that the IPC-BSS algorithm has a better F-measure value than other classical protein complex recognition algorithms. It can effectively recognize protein complexes with biological significance, and can fully recognize some large scale protein complexes. There will be some relationship between protein domains and form a domain interaction network. It explains the interaction between proteins from the spatial structure level. In this paper, the domain interaction network is used as a bridge between the protein interaction network and the disease similarity network, and the information of the multilayer heterogeneous network is fused. A non-equilibrium three-random walk algorithm, UThrRWbalanced Three Random Walk).UThrRW algorithm, is proposed, which not only exploits the information in the network, but also uses the hidden biological information between the networks. Domain interaction networks enhance the relationship between protein interactions and disease similarity networks. The experimental results show that UThrRW algorithm is better than the classical RWR algorithms in predicting disease genes, such as BiRW _ Stub1 algorithm and UBiRW algorithm.
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:Q51;Q811.4
【相似文献】
相关期刊论文 前10条
1 刘彬彬;李敏;王建新;段桂华;;基于团渗透和距离限制的蛋白质复合物识别算法[J];系统工程理论与实践;2012年02期
2 黄新;;一种基于极大团扩展的蛋白质复合物识别算法[J];饲料工业;2012年13期
3 王可玢,赵福洪,许春辉;不同叶龄黄瓜叶片叶绿素蛋白质复合物组分的比较研究[J];植物学通报;1989年04期
4 汤海旭,陈洁,丁达夫;蛋白质复合物结合自由能的预测(英文)[J];生物化学与生物物理学报;1998年02期
5 杨丹慧;许春辉;王可玢;戴云玲;;镉离子对菠菜叶绿体色素蛋白质复合物及激发能分配的影响[J];Journal of Integrative Plant Biology;1990年03期
6 胡伟;汤希玮;;一种新的基于多数据源的蛋白质复合物识别算法[J];计算机与应用化学;2014年04期
7 汤希玮;王建新;胡秋玲;;蛋白质复合物预测方法分析与比较[J];计算机应用研究;2011年10期
8 储钟稀,牟梦华,邵宏翔,王凤珍;铈对黄瓜叶绿体叶绿素蛋白质复合物形成的影响[J];植物学报;1994年10期
9 王可玢,娄世庆,赵福洪,戴云玲,匡廷云;长期二氧化碳倍增对大豆、谷子叶片的叶绿素蛋白质复合物的影响[J];科学通报;1997年11期
10 李爱芬,陈敏,周百成;褐藻色素-蛋白质复合物PAGE分离研究[J];烟台大学学报(自然科学与工程版);1999年03期
相关会议论文 前6条
1 蒋思婧;马立新;陈焕春;;表达蛋白质复合物的伪狂犬病毒系统的建立[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
2 汪文俊;王广策;马圣媛;孙海宝;曾呈奎;;条斑紫菜类囊体膜的分离以及色素-蛋白质复合物的分离以及特性的初步研究[A];中国藻类学会第十一次学术讨论会论文摘要集[C];2001年
3 汪文俊;王广策;马圣媛;刘洪艳;孟斌;烫晓荣;孙海宝;曾呈奎;;条斑紫菜类囊体膜的分离以及色素-蛋白质复合物的分离以及特性的初步研究[A];中国科学院海洋科学青年学术研讨会暨2001年海洋湖沼科学青年学者论坛论文摘要集[C];2001年
4 都建;秦宜德;姚雪彪;;一个新的与CENP-E结合的动点蛋白CENP-V的发现与功能研究[A];华东六省一市生物化学与分子生物学会2010年学术交流会论文集[C];2010年
5 邵锦震;张宇博;丁毅;;水稻类囊体膜蛋白质复合物的BN/SDS-PAGE分离与蛋白质组学研究[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
6 唐淳;;极弱蛋白质瞬态复合体与磷酸信号转导[A];中国生物化学与分子生物学会第十一次会员代表大会暨2014年全国学术会议论文集——专题报告一[C];2014年
相关博士学位论文 前6条
1 张伟;病毒诱导的先天免疫信号网络的数学建模和蛋白质复合物识别[D];武汉大学;2014年
2 任峻;蛋白质网络中复合物的挖掘与应用研究[D];中南大学;2013年
3 潘建义;大肠埃希氏菌蛋白质复合物组的鉴定分析及重要复合物的功能研究[D];厦门大学;2008年
4 徐博;基于蛋白质关系网络的复合物抽取研究[D];大连理工大学;2014年
5 彭玮;基于随机游走模型的蛋白质网络研究[D];中南大学;2013年
6 常珊;蛋白质结构预测方法学研究[D];北京工业大学;2009年
相关硕士学位论文 前10条
1 彭小清;动态蛋白质网络的构建和蛋白质复合物识别研究[D];中南大学;2012年
2 赵艳丽;基于时序网络的蛋白质复合物挖掘与疾病基因预测研究[D];华中师范大学;2015年
3 易阳;基于结构域信息的蛋白质复合物识别与疾病基因预测[D];华中师范大学;2016年
4 王丹阳;基于路径相似性的蛋白质复合物检测方法[D];西安电子科技大学;2012年
5 李鹏;基于蛋白质亲和密度扩展的蛋白质复合物挖掘[D];华中师范大学;2014年
6 张海;大鼠神经细胞蛋白质复合物组学和多肽组学研究[D];湖南师范大学;2010年
7 武学鸿;蛋白质网络的聚类分析方法及评估[D];中南大学;2013年
8 李灿;基于基因本体的蛋白质网络中蛋白质复合物识别算法研究[D];湖南大学;2013年
9 刘女英;Blue native-PAGE分离复合物方法的建立及其在膜蛋白质复合物鉴定中的应用[D];湖南师范大学;2011年
10 刘鹏飞;基于传播理论的蛋白质复合物挖掘算法研究[D];华中师范大学;2014年
,本文编号:1661243
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/1661243.html