基于序列和PPI网络的蛋白质功能预测方法研究

发布时间:2017-12-07 06:06

  本文关键词:基于序列和PPI网络的蛋白质功能预测方法研究


  更多相关文章: 蛋白质序列 功能预测 基因本体 语义相似性 PPI网络 结构域相互作用


【摘要】:蛋白质功能预测是后基因组时代生物信息学研究中最具挑战性的任务之一。目前,大量蛋白质氨基酸序列(简称“序列”)和蛋白质相互作用(Protein-Protein Interaction,PPI)数据的积累,为揭示蛋白质功能提供了基础条件。本文从蛋白质序列和PPI出发,对基于序列的蛋白质功能预测、蛋白质功能相似性计算、PPI网络构建和基于PPI网络的蛋白质功能预测等计算问题进行深入研究,并取得了一些创新性的成果。本文主要包括以下四个方面的内容:(1)提出基于序列结构域组成的蛋白质功能预测方法现有的计算方法往往需要利用除序列之外其它生物学信息才能预测蛋白质的功能,因此难以预测仅仅具有序列信息的蛋白质的功能。由于结构域是蛋白质中的保守序列片段,是其功能、结构和进化的基本单位,广泛地存在于蛋白质中,并且蛋白质的结构域组成信息容易被获取,所以本文以蛋白质序列的结构域组成信息为基础,设计一种预测蛋白质功能的计算方法。该方法首先研究结构域和GO(Gene Ontology)术语之间的关联关系,并提出利用对称的条件概率方法度量它们之间的关联强度。接着,根据术语的语义关系扩展结构域与术语之间的关联关系。最后,以结构域与术语之间的关联关系为基础,结合蛋白质序列的结构域组成信息预测其功能。与同类方法相比较,本文所提出的蛋白质功能预测方法具有较高的召回率和精确度。此外,该方法直接利用蛋白质的序列特征进行功能预测,不受其它生物学特征信息的限制。(2)提出基于GO术语语义的蛋白质功能相似性计算方法GO术语被广泛用于描述蛋白质的功能。通过GO术语语义比较蛋白质的功能相似性,对于预测蛋白质功能及其功能信息的迁移十分有益。因此,基于GO术语语义计算蛋白质功能相似性的问题受到了广泛关注。现有的蛋白质功能相似性计算方法往往忽略术语之间的语义重叠关系,从而导致计算存在不可预知的误差。针对这一问题,本文提出了一种新的蛋白质功能相似性计算方法。首先,根据语义详尽程度和覆盖度计算术语的语义信息量。然后,将术语语义分为继承语义和扩展语义两部分,并以此为基础计算术语集合的语义信息量。最后,通过术语集合之间的语义重叠率来度量两个蛋白质之间的功能相似性。与同类方法相比较,本文所提出的方法获得了更准确的计算结果,能够为判断蛋白质之间的功能相似性提供更可靠的依据。(3)提出基于结构域相互作用的PPI网络构建方法蛋白质往往通过与其他蛋白质相互协作来执行某一功能。研究PPI网络能帮助人们从系统层面理解蛋白质的功能。然而,现有的PPI数据中存在大量的假阳性和假阴性数据,阻碍了从系统层面研究蛋白质的功能。为此,本文设计了一种基于结构域相互作用构建PPI网络的方法。首先,从蛋白质中共现结构域的组合中筛选结构域相互作用。然后,基于结构域相互作用挖掘潜在的PPI以扩展原网络。接着,重新分析扩展网络中的PPI并识别跨蛋白质的结构域相互作用。最后,基于跨蛋白质的结构域相互作用重新评估PPI的可靠性,剔除扩展网络中的假阳性PPI。与传统方法相比较,本文所提出方法可以构建较为全面、可靠的PPI网络。该方法可以用于构建新的PPI网络,也可用于重构已有的PPI网络。(4)提出基于PPI网络的蛋白质功能预测方法从PPI网络层面研究蛋白质功能可以较为系统、全面地了解蛋白质的功能机理,也是蛋白质功能研究的热点之一。现有的方法通常认为相互作用的蛋白质具有相同的功能。实际上大多数相互作用的蛋白质之间存在功能差异。为此,本文设计了一种基于PPI网络的蛋白质功能预测方法。该方法首先将相互作用的蛋白质之间的关系抽象为主-被动关系,然后根据主-被动关系筛选处于同一通路的GO术语注释相互作用的蛋白质,并设计迭代算法在相互作用网络中预测蛋白质功能。从预测的精确度、召回率和F值三个指标来看,基于PPI网络的蛋白质功能预测方法的综合性能优于同类方法。
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:Q51;Q811.4

【相似文献】

中国期刊全文数据库 前10条

1 曾岚,徐晋麟,李亦学,石铁流;大规模蛋白质功能预测方法的进展[J];生命的化学;2005年01期

2 卢宏超;石秋艳;石宝晨;张治华;赵屹;唐素勤;熊磊;王强;陈润生;;基于蛋白质网络功能模块的蛋白质功能预测[J];生物化学与生物物理进展;2006年05期

3 王繁业;李亚非;;用于新药开发的新的蛋白质功能预测方法[J];化学与生物工程;2006年09期

4 王秀鹤;王正华;王勇献;张振慧;;基于分组重量编码的蛋白质功能预测[J];生物信息学;2007年01期

5 倪青山;王正志;黎刚果;孟祥林;;基于K近邻的蛋白质功能的预测方法[J];生物医学工程研究;2009年02期

6 蒋英芝;贺连华;刘建军;;蛋白质功能研究方法及技术[J];生物技术通报;2009年09期

7 胡敏菁;吴建盛;施识帆;刘宏德;孙啸;;面向蛋白质功能位点识别的机器学习平台构建[J];生物信息学;2010年01期

8 赵研;卢奕南;权勇;;基于模糊积分多源数据融合的蛋白质功能预测[J];南京大学学报(自然科学版);2012年01期

9 吴建盛;;基于新型机器学习方法的蛋白质功能预测与分析[J];信息通信;2012年05期

10 刘言;沈素萍;方慧生;陈凯先;;蛋白质功能预测方法概述[J];生物信息学;2013年01期

中国重要会议论文全文数据库 前10条

1 卢乃浩;张燕;李海玲;高中洪;;蛋白质酪氨酸硝化修饰对蛋白质功能影响及抗氧化剂的作用[A];第六届全国化学生物学学术会议论文摘要集[C];2009年

2 郭延芝;李梦龙;;蛋白质功能预测中的特征筛选与优化[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年

3 汪世华;;蛋白质芯片用于快速检测的研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年

4 郭延芝;文志宁;李梦龙;;基于序列信息的蛋白质功能预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

5 王靖;李霞;高磊;朱明珠;杨德武;;蛋白质功能位点和结构域与人类蛋白质互作关联分析[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年

6 刘克良;梁远军;;肽类药物研究进展[A];2006第六届中国药学会学术年会大会报告集[C];2006年

7 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年

8 常珊;李春华;龚新奇;陈慰祖;王存新;;蛋白质不同区域的氨基酸保守性网络分析[A];第十次中国生物物理学术大会论文摘要集[C];2006年

9 张长胜;来鲁华;;基于关键相互作用的蛋白质功能设计[A];第五届全国化学生物学学术会议论文摘要集[C];2007年

10 李亦学;;蛋白质组功能注释[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年

中国重要报纸全文数据库 前4条

1 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年

2 刘云涛;北大蛋白质功能设计研究获新进展[N];中国医药报;2007年

3 记者 吴仲国;日首次公开招募研究人员[N];科技日报;2001年

4 华琳 王治强;我校三项“973”项目通过科技部验收[N];新清华;2005年

中国博士学位论文全文数据库 前9条

1 滕志霞;基于序列和PPI网络的蛋白质功能预测方法研究[D];哈尔滨工业大学;2016年

2 孙承磊;基于数据挖掘技术的蛋白质功能预测研究[D];上海大学;2013年

3 窦永超;预测蛋白质功能位点的几种新数学模型[D];大连理工大学;2011年

4 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年

5 俞晓晶;基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D];中国科学院研究生院(上海生命科学研究院);2006年

6 张同亮;基于智能计算的蛋白质功能预测研究[D];东华大学;2008年

7 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年

8 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年

9 张拓;两种特殊类型蛋白质功能残基的预测与生物序列比对[D];南开大学;2009年

中国硕士学位论文全文数据库 前10条

1 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年

2 赵研;模糊积分在蛋白质功能预测上的应用[D];吉林大学;2012年

3 郭金文;基于序列循环关系网络模型的蛋白质功能预测技术研究[D];福建师范大学;2015年

4 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年

5 王秀鹤;基于序列和相互作用的蛋白质功能预测[D];国防科学技术大学;2006年

6 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年

7 刁印;基于图理论和互作网络的蛋白质功能预测研究[D];大连理工大学;2015年

8 贾元丰;基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测[D];山西大学;2013年

9 刘昊;基于聚类算法和相互作用网络的蛋白质功能预测研究[D];湖南大学;2009年

10 张信;基于多数据源融合的蛋白质功能预测方法研究[D];大连理工大学;2015年



本文编号:1261379

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/1261379.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户25ba6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com