基于图理论和互作网络的蛋白质功能预测研究
本文关键词:基于图理论和互作网络的蛋白质功能预测研究
更多相关文章: 蛋白质功能预测 有向双关系图 多核学习 直推式学习
【摘要】:蛋白质几乎参与了细胞生命活动的全程,在其中扮演重要的角色。蛋白质组学收集整合了蛋白质相互作用及其在网络中不同层次的信息来预测蛋白质功能,继而掌握生命体疾病发生以及细胞代谢等过程和规律,为医学研究提供依据。科学家们通过高通量生物实验和计算方法获得大量直接或者间接的蛋白质相互作用数据,这些数据中的假阳性和假阴性噪声使数据质量下降,导致蛋白质功能预测的结果出现偏差,影响了数据的准确率。本文针对这些问题,利用蛋白质相互作用网络图的相关特点,依据图理论的有关特性,引入有向双关系图等构图知识,结合多核学习以及直推式学习方法,构建了以图理论为基础的多标记模型,并在酵母和小鼠的蛋白质多源异构数据中进行了实验,验证了模型的优势以及方法的有效性。针对多源异构蛋白质数据信息量巨大,噪声冗余导致预测结果出现偏差,反映数据分布信息不全面,影响预测结果的准确性,本节采用有向双关系图和多核融合的方法预测蛋白质功能。首先使用有向双关系图来代替蛋白质网络和功能网络间关系,通过图优化策略将功能类别网络和蛋白质相互作用网络构成的多个网络进行融合,最后将融合后的网络矩阵代入到含有损失函数的目标方程中,使用最大期望算法预测蛋白质功能,通过在酵母和小鼠上的实验验证了方法的有效性。针对多核融合过程中需要多次计算组合系数,对内存的需求量较大、时间消耗多和现实生活中标签集非常欠缺的问题,本节采用了有向双关系图和直推式多标记学习方法来进行蛋白质功能预测,将大量的无标记数据和部分有标记数据结合在一起,通过挖掘它们之间有限的近邻信息,将维度扩充后的相互作用矩阵应用到图优化模型中求解功能标签的排序以及个数,从而实现为无标记数据分配标签的方法,为进一步提高精确度,数据源采用蛋白质多源异构数据,最后使用了分类器集成策略来对结果进行优化集成。通过实验结果,说明了本文提出的方法与其他多核多标记分类方法对比具有明显优势,分类性能稳定。
【关键词】:蛋白质功能预测 有向双关系图 多核学习 直推式学习
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q51;O157.5
【目录】:
- 摘要4-5
- Abstract5-9
- 1 绪论9-15
- 1.1 研究背景与意义9-11
- 1.2 国内外研究现状11-13
- 1.2.1 图和复杂网络理论在生物网络中应用11-12
- 1.2.2 基于相互作用网络的蛋白质功能预测研究现状12-13
- 1.3 本文的工作13-15
- 2 蛋白质相互作用网络研究15-25
- 2.1 蛋白质相互作用网络15-18
- 2.1.1 蛋白质间相互作用15-16
- 2.1.2 相关数据介绍16-18
- 2.2 网络图构建18-21
- 2.2.1 生物背景知识构图19-20
- 2.2.2 多源信息融合构图20
- 2.2.3 网络拓扑特性构图20-21
- 2.3 网络图优化21-22
- 2.3.1 图的分类21-22
- 2.3.2 图的降维22
- 2.4 网络图融合22-24
- 2.4.1 前端融合22-23
- 2.4.2 中端融合23-24
- 2.4.3 后端融合24
- 2.5 本章小结24-25
- 3 基于多核学习和有向双关系图的功能预测25-37
- 3.1 蛋白质功能预测的计算方法25-27
- 3.1.1 基于图的多标记分类25-27
- 3.1.2 基于数据源优化的多核学习27
- 3.2 算法描述27-30
- 3.3 结果与分析30-36
- 3.3.1 实验数据30
- 3.3.2 实验性能评价指标30-32
- 3.3.3 实验结果分析32-34
- 3.3.4 参数敏感性分析34-36
- 3.4 本章小结36-37
- 4 基于直推式学习和有向双关系图的功能预测研究37-47
- 4.1 问题引入37-38
- 4.2 直推式多标记学习38-39
- 4.3 基于有向双关系图的直推式多标记集成分类39-43
- 4.3.1 基本思想39-41
- 4.3.2 算法描述41-43
- 4.4 实验及结果分析43-46
- 4.4.1 实验数据及设置43
- 4.4.2 结果和分析43-45
- 4.4.3 参数分析45-46
- 4.5 本章小结46-47
- 结论47-48
- 参考文献48-53
- 攻读硕士学位期间发表学术论文情况53-54
- 致谢54-55
【相似文献】
中国期刊全文数据库 前10条
1 曾岚,徐晋麟,李亦学,石铁流;大规模蛋白质功能预测方法的进展[J];生命的化学;2005年01期
2 卢宏超;石秋艳;石宝晨;张治华;赵屹;唐素勤;熊磊;王强;陈润生;;基于蛋白质网络功能模块的蛋白质功能预测[J];生物化学与生物物理进展;2006年05期
3 王繁业;李亚非;;用于新药开发的新的蛋白质功能预测方法[J];化学与生物工程;2006年09期
4 王秀鹤;王正华;王勇献;张振慧;;基于分组重量编码的蛋白质功能预测[J];生物信息学;2007年01期
5 倪青山;王正志;黎刚果;孟祥林;;基于K近邻的蛋白质功能的预测方法[J];生物医学工程研究;2009年02期
6 蒋英芝;贺连华;刘建军;;蛋白质功能研究方法及技术[J];生物技术通报;2009年09期
7 胡敏菁;吴建盛;施识帆;刘宏德;孙啸;;面向蛋白质功能位点识别的机器学习平台构建[J];生物信息学;2010年01期
8 赵研;卢奕南;权勇;;基于模糊积分多源数据融合的蛋白质功能预测[J];南京大学学报(自然科学版);2012年01期
9 吴建盛;;基于新型机器学习方法的蛋白质功能预测与分析[J];信息通信;2012年05期
10 刘言;沈素萍;方慧生;陈凯先;;蛋白质功能预测方法概述[J];生物信息学;2013年01期
中国重要会议论文全文数据库 前10条
1 卢乃浩;张燕;李海玲;高中洪;;蛋白质酪氨酸硝化修饰对蛋白质功能影响及抗氧化剂的作用[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
2 郭延芝;李梦龙;;蛋白质功能预测中的特征筛选与优化[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
3 汪世华;;蛋白质芯片用于快速检测的研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
4 郭延芝;文志宁;李梦龙;;基于序列信息的蛋白质功能预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
5 王靖;李霞;高磊;朱明珠;杨德武;;蛋白质功能位点和结构域与人类蛋白质互作关联分析[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
6 刘克良;梁远军;;肽类药物研究进展[A];2006第六届中国药学会学术年会大会报告集[C];2006年
7 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
8 常珊;李春华;龚新奇;陈慰祖;王存新;;蛋白质不同区域的氨基酸保守性网络分析[A];第十次中国生物物理学术大会论文摘要集[C];2006年
9 张长胜;来鲁华;;基于关键相互作用的蛋白质功能设计[A];第五届全国化学生物学学术会议论文摘要集[C];2007年
10 李亦学;;蛋白质组功能注释[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
中国重要报纸全文数据库 前4条
1 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
2 刘云涛;北大蛋白质功能设计研究获新进展[N];中国医药报;2007年
3 记者 吴仲国;日首次公开招募研究人员[N];科技日报;2001年
4 华琳 王治强;我校三项“973”项目通过科技部验收[N];新清华;2005年
中国博士学位论文全文数据库 前8条
1 孙承磊;基于数据挖掘技术的蛋白质功能预测研究[D];上海大学;2013年
2 窦永超;预测蛋白质功能位点的几种新数学模型[D];大连理工大学;2011年
3 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年
4 俞晓晶;基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D];中国科学院研究生院(上海生命科学研究院);2006年
5 张同亮;基于智能计算的蛋白质功能预测研究[D];东华大学;2008年
6 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年
7 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年
8 张拓;两种特殊类型蛋白质功能残基的预测与生物序列比对[D];南开大学;2009年
中国硕士学位论文全文数据库 前10条
1 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
2 赵研;模糊积分在蛋白质功能预测上的应用[D];吉林大学;2012年
3 郭金文;基于序列循环关系网络模型的蛋白质功能预测技术研究[D];福建师范大学;2015年
4 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
5 王秀鹤;基于序列和相互作用的蛋白质功能预测[D];国防科学技术大学;2006年
6 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年
7 刁印;基于图理论和互作网络的蛋白质功能预测研究[D];大连理工大学;2015年
8 贾元丰;基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测[D];山西大学;2013年
9 刘昊;基于聚类算法和相互作用网络的蛋白质功能预测研究[D];湖南大学;2009年
10 张信;基于多数据源融合的蛋白质功能预测方法研究[D];大连理工大学;2015年
,本文编号:750558
本文链接:https://www.wllwen.com/kejilunwen/yysx/750558.html