基于网络拓扑特性的关键蛋白质识别算法的研究
本文关键词:基于网络拓扑特性的关键蛋白质识别算法的研究,,由笔耕文化传播整理发布。
【摘要】:随着生物信息学的迅速发展,人们对生物学的研究已经逐渐扩展到蛋白质组学的层面。关键蛋白质的移除会造成有关蛋白质功能模块的功能丧失,进而使细胞无法正常的进行生命活动,从而导致生物体无法生存。关键蛋白识别与保护是药物开发的基础,它对于理解细胞生命活动的必需物质具有十分重要的理论意义和应用价值。基于试验数据利用计算方法识别关键蛋白质可以极大地节省时间和资源,所以对蛋白质相互作用网络中的关键蛋白质进行识别是生物信息学领域的一个重要研究方向。目前,比较常用的关键蛋白质识别算法有:度中心性测度算法、接近度中心性测度算法、介数中心性测度算法、桥中心性测度算法、局部平均连接中心性测度算法、网络中心性测度算法等,但这些测度算法仅仅从蛋白质相互作用网络的全局信息或者局部信息对关键蛋白质进行识别。本文通过分析功能模块与关键蛋白质的关系,提出了一种能够从局部反映蛋白质相互作用网络中各蛋白质顶点拓扑特性的指标—局部系数,并设计了结合局部系数和点介数的中心性测度算法—LBC中心性测度算法。由于该算法不仅包含了蛋白质相互作用网络的全局信息,而且又融合了蛋白质分子的局部信息,所以能更全面的对关键蛋白质进行识别。试验结果表明,在无标度网络中,LBC算法的关键蛋白质识别率比上述六种测度算法高10%以上。并且在算法的稳定性和普遍性方面,LBC算法也优于上述六种测度算法。由于LBC算法中的介数中心性计算的时间复杂度较高,所以本文从两个方面对其进行了改进。一方面是对算法本身进行改进,在计算介数中心性时利用VC维理论控制样本大小只对部分最短路径进行计算,使得在精度降低不大的情况下大幅度提高了计算效率。另一方面利用GPU对算法进行加速,设计并实现了基于CUDA架构的介数中心性算法,通过GPU硬件加速。试验结果表明,基于CUDA的LBC算法在保证检测精度不变的情况下将计算时间缩短了20-100倍。
【关键词】:蛋白质相互作用网络 关键蛋白质 中心性测度算法 VC维理论 CUDA平台
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.02;Q51
【目录】:
- 致谢5-6
- 摘要6-7
- ABSTRACT7-11
- 1 绪论11-17
- 1.1 研究背景及意义11-12
- 1.2 蛋白质相互作用网络12-13
- 1.3 国内外研究现状13-15
- 1.4 研究内容和工作15
- 1.5 本文组织结构15-17
- 2 中心性测度算法与CUDA概述17-27
- 2.1 中心性测度算法17-21
- 2.2 VC维理论21-22
- 2.3 CUDA概述22-26
- 2.3.1 CUDA编程模型23-24
- 2.3.2 CUDA线程24-25
- 2.3.3 CUDA内存25-26
- 2.4 本章小结26-27
- 3 融合局部特征的介数中心性算法27-53
- 3.1 介数中心性算法27-29
- 3.2 局部系数29-32
- 3.2.1 蛋白质相互作用网络的结构分析29-31
- 3.2.2 局部系数31-32
- 3.3 融合局部特征的中心性测度算法32-35
- 3.4 函数F的确定35-37
- 3.4.1 评价标准35-36
- 3.4.2 确定函数f的表达式36-37
- 3.5 预测结果与分析37-52
- 3.5.1 数据集37-38
- 3.5.2 六个样本水平评估38-40
- 3.5.3 统计学性能评估40-41
- 3.5.4 P-R曲线评估41-44
- 3.5.5 刀切法评估44-46
- 3.5.6 LBC与其它测度的差异性评估46-50
- 3.5.7 综合分析50-52
- 3.6 本章小结52-53
- 4 基于抽样和CUDA的LBC算法的实现53-65
- 4.1 基于抽样的LBC算法的实现53-59
- 4.1.1 抽样样本大小的确定53-55
- 4.1.2 抽样LBC算法的实现55-57
- 4.1.3 试验结果57-59
- 4.2 基于CUDA的LBC算法的实现59-64
- 4.2.1 构建并行算法的方法60
- 4.2.2 LBC算法的并行实现60-63
- 4.2.3 试验结果63-64
- 4.3 本章小结64-65
- 5 总结与展望65-67
- 参考文献67-71
- 作者简历及攻读硕士学位期间取得的研究成果71-73
- 学位论文数据集73
【相似文献】
中国期刊全文数据库 前10条
1 梁琳慧,韩忠朝;蛋白质相互作用的研究方法[J];生命的化学;2005年03期
2 唐泽耀,戴淑芳,陈华,林原;蛋白质相互作用研究的哲学思考[J];医学与哲学;2005年01期
3 曹建平,马义才,李亦学,石铁流;计算方法在蛋白质相互作用研究中的应用[J];生命科学;2005年01期
4 谢江;张武;梅健;顾知立;吴继宗;李辉;张律文;;一种新的计算预测alpha-synuclein蛋白质相互作用网络的方法(英文)[J];Journal of Shanghai University(English Edition);2008年06期
5 余鑫煜;许正平;;蛋白质相互作用数据库及其应用[J];中国生物化学与分子生物学报;2008年03期
6 刘中扬;李栋;朱云平;贺福初;;蛋白质相互作用网络进化分析研究进展[J];生物化学与生物物理进展;2009年01期
7 王正华;董蕴源;王勇献;;蛋白质相互作用网络的几种聚类方法综述[J];国防科技大学学报;2009年04期
8 陆林英;魏雅卓;崔颖;孙平平;马雅楠;马志强;;基于支持向量机的蛋白质相互作用识别[J];生物信息学;2009年04期
9 王建新;蔡钊;李敏;;一种基于极大团的蛋白质相互作用预测方法[J];高技术通讯;2009年01期
10 李松倍;谢江;张武;武频;;蛋白质相互作用网络的相似子网搜索问题研究[J];计算机工程与应用;2010年03期
中国重要会议论文全文数据库 前10条
1 刘珍;孙景春;谢锦云;李亦学;梁宋平;石铁流;;蛋白质相互作用网络中的生物途径分析[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
2 李占潮;周漩;戴宗;邹小勇;;基于一级结构信息预测蛋白质与蛋白质相互作用[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
3 王存新;马晓慧;陈慰祖;;构象熵对蛋白质-蛋白质相互作用及结合自由能的贡献[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
4 程钢;吴松锋;陈廷贵;万平;朱云平;贺福初;;22周孕龄胎肝蛋白质相互作用网络的构建[A];中国蛋白质组学首届学术大会论文摘要集[C];2003年
5 杨晓明;王建;许望翔;虞东辉;杨永升;刘琼明;周颖;张翠莉;吴志豪;张万巧;刘涛;唐刘君;原艳芝;郝峰;金超智;贺福初;;人类肝脏重要蛋白质相互作用连锁图研究进展[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
6 吴俊;邓宏钟;朱大智;谭跃进;;蛋白质相互作用网络的度秩函数与度分布[A];2006全国复杂网络学术会议论文集[C];2006年
7 李令东;田瑞军;唐伟;邹汉法;赵宗保;;携异戊烯链小分子与蛋白质相互作用的研究[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
8 李立;肖奕;孙之荣;;酵母蛋白质相互作用网络的模块进化[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
9 陈慰祖;庄彦;王存新;;用分子模拟方法研究胰岛素二聚体的相互作用和识别[A];第三届全国现代生物物理技术学术讨论会论文摘要汇编[C];2000年
10 马文;刘艳清;郭琼;邓玉林;;生物功能化色谱法研究胰岛素及其受体间的相互作用[A];第十五次全国色谱学术报告会文集(上册)[C];2005年
中国重要报纸全文数据库 前10条
1 记者 常丽君;科学家绘制出迄今最详细蛋白质相互作用图[N];科技日报;2011年
2 胡德荣;蛋白质相互作用网络预测新方法被发现[N];健康报;2007年
3 通讯员 甄蓓 特约记者 吴志军;肝脏蛋白质相互作用图绘出[N];健康报;2011年
4 甄蓓;我科学家成功绘制人类肝脏蛋白质相互作用网络连锁图[N];科技日报;2011年
5 甄蓓;人类肝脏蛋白质“关系网络图”绘成[N];中国医药报;2011年
6 毛黎;美开发细胞内蛋白质相互作用标识技术[N];科技日报;2007年
7 张佳星;人类为何如此与众不同[N];科技日报;2008年
8 白毅;我国计算生物学研究取得重要进展[N];中国医药报;2007年
9 余志平 编译;PCAs给我们带来了什么?[N];中国医药报;2007年
10 欣文;蛋白质相互作用导致疑难病症[N];医药经济报;2002年
中国博士学位论文全文数据库 前10条
1 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年
2 梁治;蛋白质相互作用网络的比较生物学分析及其应用[D];中国科学技术大学;2006年
3 王晓敏;基于蛋白质相互作用网络的功能模块识别及功能预测研究[D];国防科学技术大学;2013年
4 胡静;基于密度聚类和特征分类的蛋白质相互作用热区预测[D];武汉科技大学;2015年
5 谢江;蛋白质相互作用网络的数值研究[D];上海大学;2008年
6 史明光;蛋白质相互作用预测方法的研究[D];中国科学技术大学;2009年
7 杜秀全;基于智能计算的蛋白质相互作用预测方法研究[D];安徽大学;2010年
8 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年
9 庞开放;基于基因表达和蛋白质相互作用数据集成的蛋白质进化、功能重要性和动态模块化组织的研究[D];上海交通大学;2011年
10 冯铁男;基于小波的蛋白质相互作用网络的研究[D];上海大学;2011年
中国硕士学位论文全文数据库 前10条
1 董蕴源;基于谱方法的蛋白质相互作用网络分析[D];国防科学技术大学;2007年
2 邴志桐;蛋白质相互作用网络度分布的研究[D];兰州大学;2009年
3 杨晓飞;基于多源数据融合的蛋白质—蛋白质相互作用网络构建方法研究[D];中国科学技术大学;2009年
4 刘U
本文编号:354913
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/354913.html