当前位置:主页 > 医学论文 > 西医药论文 >

基于网络拓扑的蛋白质互作预测及相关内容的研究

发布时间:2020-07-23 21:34
【摘要】:蛋白质作为生命的物质基础,很少以单独个体进行活动,而是以一种非常明确的方式相互作用(互作)来协调几乎所有的细胞过程。因此,蛋白质互作分析是理解细胞组织和分子功能的基础。蛋白质网络是由直接的物理互作构成,能够代表一个具体的生物学系统。它可以揭示器官功能,了解组织结构,从而确定人类疾病的致病机理和寻找基因治疗的药物靶点。高通量的生物学实验技术提供了大量的蛋白质互作数据,为蛋白质网络的研究提供了数据支持。本文利用网络拓扑属性,整合分子功能和疾病相关信息,能够确定蛋白质网络中隐藏的功能模块和疾病信息。目前,基于蛋白质互作网络预测蛋白质互作,确定功能模块与疾病蛋白质的研究主要面临两方面问题:(一)基于不可靠的网络数据,包括噪声(假阳性互作)和缺失(假阴性互作),会误导或干扰相关研究;(二)基于不同特征、质量和数量的数据,会产生互作预测波动,预测质量和覆盖率有待提高,从而影响网络中的功能模块和疾病模块的完整性。本文基于已知的蛋白质互作网络,以团(极大完全子网)等网络拓扑侧度为核心,预测蛋白质互作,挖掘网络中的功能模块,预测疾病蛋白质。首先,提出了一种可靠蛋白质互作预测的框架模型来修补蛋白质互作网络,并基于该模型预测与功能模块或蛋白质复合物相关的蛋白质互作;其次,用修补后的网络挖掘相关模块;最后,基于疾病模块预测疾病蛋白质。本文解决了在含有假阳性和假阴性互作数据的网络中,预测蛋白质互作波动的问题,并利用扩展的团更大限度的逼近实际的功能模块和疾病模块。研究的具体内容主要体现在以下四个方面:一、提出一种基于宽进严出策略的预测可靠蛋白质互作的框架模型。首先,设定已有的预测蛋白质互作的计算方法的预测可靠性等级;然后,根据预测方法之间的兼容性和互补性原则,整合若干子方法;最后,通过预测和评估两个过程获取最终的蛋白质互作预测集。每个预测的蛋白质互作均满足多种生物学意义,其预测可靠性更高。该框架模型为本文基于蛋白质互作网络预测蛋白质互作的具体方法提供基础。二、分别提出基于宽进严出框架的显性和隐性预测蛋白质互作的方法。在显性模式下,设计了两种预测方法。第一种方法完全符合宽进严出模型标准,针对不同特征的互作数据集,包括含有大量噪声的数据集,均能稳定的获取可靠的蛋白质互作预测;第二种方法提供了简化使用宽进严出框架的实例,利用预测的互作参与新的预测过程,可以获取更多的蛋白质互作;同时,通过使用不同的基因本体论修正规则,分别获得质量和数量占优的预测集。在隐性模式下,针对已经发现复合物的不同拓扑结构特征,分别提出一种基于桥分割复合物的预测算法和一种自适应k核聚类剪枝预测算法。前者针对多子网结构的复合物,可获较高准确率的互作预测;后者具有通用性,能够较好适应各种不同结构的复合物。这两种算法预测的蛋白质互作与功能模块和复合物相关,有助于发现更准确的功能模块和疾病模块。三、提出一种基于候选集竞争方法来确定网络中潜在团。本文在扩展团的基础上,挖掘候选集中结点间的隐藏信息,采用贪心方法,竞争挑选最大可能的候选结点来扩展团。并且,候选集合的确定不是静态过程,而是根据当前扩展的团,动态生成,继续竞争挑选候选结点来扩展团。以此类推,直至确定最终的潜在团。潜在团中包含的未知蛋白质互作,绝大部分可通过相关的验证。挖掘的潜在团接近于实际真实的团,具有较好的生物学意义,克服了网络数据缺失的影响。四、提出一种在蛋白质网络中基于团骨架预测疾病蛋白质的方法。首先,利用扩展团的方法挖掘潜在团;然后,根据已知疾病蛋白质在团中的显著性确定疾病相关的团,从而预测疾病蛋白质;最后,利用基因本体论注释为预测的蛋白质打分,决定最终的疾病蛋白质。该方法能够克服原始数据中假阳性和假阴性数据的干扰。本文通过基因型和表型的关联,可知预测的疾病蛋白质保持较高准确率。并且,基于疾病团预测的疾病蛋白质之间,存在紧密联系,且关联复杂疾病,如各种癌症等,为揭示严重疾病的致病机理提供线索。第一项研究内容属于框架模型,为本文的整体研究提供一个指导性框架;第二项研究内容提供蛋白质互作预测的方法,属于网络数据的修补,为后续网络模块的挖掘打下基础;第三项研究内容利用潜在团挖掘网络中的模块;第四项研究内容利用确定网络模块的方法寻找疾病模块并预测疾病蛋白质。本文通过对网络数据的修补,可以较好地解决网络拓扑结构易受假阴性和假阳性数据干扰的问题;并且,预测的蛋白质互作同功能模块和疾病模块紧密关联,从而可以确定相对完整的两种网络模块,进而更加准确的解决相关的生物学问题。
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:Q811.4;R3411
【图文】:

研究脉络,蛋白质,生物功能,细胞


图 1-1 本文基于蛋白质互作网络的相关内容研究脉络Fig. 1-1 Research direction based on the protein interaction network in the pape蛋白质是生物功能的主要体现者。为了协调几乎所有的细胞过程, 复制和转录,RNA 连接和传导,蛋白质修改和分泌,以及细胞循凋亡,蛋白质之间以一种非常明确的方式进行相互作用[6]。蛋白质

统计分析,科学引文索引,系统生物学,相关主题


蛋白质互作网络方面的研究仍然是系统生物学研究领域的一大热点。根据科学引文索引(Science Citation Index, SCI)调查[11],近 5 年蛋白质互作网络研究相关主题约 9000 多,且每年呈现递增趋势(如图 1-2)。发表的文章数量排名暂时为美国、中国、德国、英国、加拿大等国。而直接以蛋白质互作网络为标题撰写的文章,近 5 年约 750 篇。

互作,高通量,实验方法


固定目标蛋白质的互作[21];图1-3(f)列出合成致死(Synthetic Lethality)方法发现两个非致死突变的个体当作用在一起时导致致死的遗传互作[22]。它们发现的互作类型有所区别。酵母双杂交方法发现的为二元的物理互作(两两蛋白质互作对);质谱分析和串联亲和纯化方法发现的是复合物相关的物理互作(在一个复合物中的互作);基因共表达、蛋白质微阵列和合成致死方法发现的是功能相关的互作[16]。不同类型的互作,在蛋白质互作网络中具有不同的网络特征。图 1-3 确定互作的六种高通量实验方法[16]Fig. 1-3 Six methods of interaction identification with high throughput experiments[16]1.2.2 蛋白质互作数据库目前,与蛋白质互作相关的数据库已超过两百多个,且还处于增长中,

【共引文献】

相关期刊论文 前9条

1 张媛;贾克斌;ZHANG Aidong;;基于多视图融合的蛋白质功能模块检测方法[J];电子学报;2014年12期

2 邵淑娟;;基于蛋白质组学策略的肿瘤标记物筛选及作用机制[J];大连医科大学学报;2015年05期

3 Wen-yin NI;Hui-jun XIONG;Bi-hai ZHAO;Sai HU;;Predicting overlapping protein complexes in weighted interactome networks[J];Journal of Zhejiang University-Science C(Computers and Electronics);2013年10期

4 冀俊忠;刘志军;刘红欣;刘椿年;;蛋白质相互作用网络功能模块检测的研究综述[J];自动化学报;2014年04期

5 赵碧海;熊慧军;倪问尹;刘志兵;胡赛;;一种改进的基于加权网络的蛋白质复合物识别算法[J];计算机科学;2014年06期

6 于静;刘燕兵;张宇;刘梦雅;谭建龙;郭莉;;大规模图数据匹配技术综述[J];计算机研究与发展;2015年02期

7 赵静;方海洋;张卫东;;中药网络药理学研究中的生物信息学方法[J];药学进展;2014年02期

8 郭雨辰;雷秉坤;邓小龙;余W

本文编号:2767870


资料下载
论文发表

本文链接:https://www.wllwen.com/xiyixuelunwen/2767870.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ef32a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com