基于网络嵌入的蛋白质复合物识别研究
发布时间:2021-06-24 08:16
从蛋白质-蛋白质相互作用(Protein-protein Interaction,PPI)网络中识别蛋白质复合物是目前蛋白质组学中最重要的任务之一。大部分传统的利用计算方法的蛋白质复合物识别方法都是通过在PPI网络中挖掘稠密子图作为最终识别的蛋白质复合物。由于PPI网络存在假阳性率和假阴性率的缺点,研究人员开始试图利用生物信息来提高预测蛋白质复合物的质量。然而,如何将不同类型的生物信息整合到复合物识别过程中对研究人员来说仍然是一个挑战。近年来,网络嵌入方法由于良好的信息保持效果被广泛应用于各种网络学习任务中。因此,本文提出了基于生物属性网络嵌入方法的蛋白质复合物识别算法GANE。GANE算法首先利用网络嵌入获得蛋白质的向量表示并重新计算蛋白质对之间的相互作用强度,后续基于蛋白质复合物的结构特性进行聚类识别出最终的蛋白质复合物。GANE算法提供了一个统一的框架将各种生物信息整合到识别过程中。在GANE算法的基础上,为了克服现有网络嵌入方法存在的无法同时保存网络全局、局部结构信息和节点属性信息的缺点。本文提出一种新型网络嵌入算法,并将该算法应用于本文提出的蛋白质复合物识别算法GLONE中。...
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 蛋白质复合物识别概述
1.2 国内外蛋白质复合物识别现状
1.2.1 基于单纯PPI结构信息的蛋白质复合物识别方法
1.2.2 融合生物信息资源的蛋白质复合物识别方法
1.3 论文的研究内容
1.4 论文的组织结构
2 网络嵌入
2.1 网络嵌入相关研究
2.1.1 网络嵌入的任务
2.1.2 基于网络结构的网络嵌入方法
2.1.3 基于网络结构和外部信息的网络嵌入方法
2.2 本章小结
3 基于生物属性网络嵌入的蛋白质复合物识别算法
3.1 基因本体数据
3.2 GANE模型
3.2.1 蛋白质的向量表示学习
3.2.2 基于Core-Attachment结构信息聚类
3.3 实验及结果分析
3.3.1 实验数据
3.3.2 评价标准
3.3.3 性能评估
3.3.4 参数调研
3.4 本章小结
4 基于全局信息网络嵌入的蛋白质复合物识别算法
4.1 GLONE模型
4.1.1 基于新型网络嵌入方法的蛋白质向量表示学习
4.1.2 基于种子扩散机制聚类
4.2 实验及结果分析
4.2.1 实验数据
4.2.2 评价指标
4.2.3 性能评估
4.2.4 参数调研
4.3 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
【参考文献】:
期刊论文
[1]蛋白质组学及其研究技术概述[J]. 刘伟,刘书广,韩留福. 生物学教学. 2018(05)
[2]蛋白质复合物识别算法综述[J]. 汤希玮. 长沙大学学报. 2017(05)
[3]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
[4]基于加权网络和局部适应度的蛋白质复合物识别算法[J]. 刘翠翠,孙伟. 计算机应用研究. 2018(08)
[5]基于遗传算法的蛋白质复合物识别算法[J]. 郑文萍,李晋玉,王杰. 计算机科学与探索. 2018(05)
[6]基于关键功能模块挖掘的蛋白质功能预测[J]. 赵碧海,李学勇,胡赛,张帆,田清龙,杨品红,刘臻. 自动化学报. 2018(01)
博士论文
[1]生物医学领域的信息抽取与复合物识别研究[D]. 张益嘉.大连理工大学 2014
本文编号:3246740
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 蛋白质复合物识别概述
1.2 国内外蛋白质复合物识别现状
1.2.1 基于单纯PPI结构信息的蛋白质复合物识别方法
1.2.2 融合生物信息资源的蛋白质复合物识别方法
1.3 论文的研究内容
1.4 论文的组织结构
2 网络嵌入
2.1 网络嵌入相关研究
2.1.1 网络嵌入的任务
2.1.2 基于网络结构的网络嵌入方法
2.1.3 基于网络结构和外部信息的网络嵌入方法
2.2 本章小结
3 基于生物属性网络嵌入的蛋白质复合物识别算法
3.1 基因本体数据
3.2 GANE模型
3.2.1 蛋白质的向量表示学习
3.2.2 基于Core-Attachment结构信息聚类
3.3 实验及结果分析
3.3.1 实验数据
3.3.2 评价标准
3.3.3 性能评估
3.3.4 参数调研
3.4 本章小结
4 基于全局信息网络嵌入的蛋白质复合物识别算法
4.1 GLONE模型
4.1.1 基于新型网络嵌入方法的蛋白质向量表示学习
4.1.2 基于种子扩散机制聚类
4.2 实验及结果分析
4.2.1 实验数据
4.2.2 评价指标
4.2.3 性能评估
4.2.4 参数调研
4.3 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
【参考文献】:
期刊论文
[1]蛋白质组学及其研究技术概述[J]. 刘伟,刘书广,韩留福. 生物学教学. 2018(05)
[2]蛋白质复合物识别算法综述[J]. 汤希玮. 长沙大学学报. 2017(05)
[3]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
[4]基于加权网络和局部适应度的蛋白质复合物识别算法[J]. 刘翠翠,孙伟. 计算机应用研究. 2018(08)
[5]基于遗传算法的蛋白质复合物识别算法[J]. 郑文萍,李晋玉,王杰. 计算机科学与探索. 2018(05)
[6]基于关键功能模块挖掘的蛋白质功能预测[J]. 赵碧海,李学勇,胡赛,张帆,田清龙,杨品红,刘臻. 自动化学报. 2018(01)
博士论文
[1]生物医学领域的信息抽取与复合物识别研究[D]. 张益嘉.大连理工大学 2014
本文编号:3246740
本文链接:https://www.wllwen.com/projectlw/swxlw/3246740.html
教材专著