基于密度聚类和特征分类的蛋白质相互作用热区预测

发布时间:2020-10-13 06:49
   蛋白质功能由蛋白质相互作用进行表达,蛋白质与蛋白质相互作用的界面上并非所有的残基都是重要的,有时只有少数几个残基对蛋白质的结合起着关键的作用,这些起关键作用的残基称为热点残基。大量实验表明,热点残基在蛋白质与蛋白质相互作用中会形成一种特定的构象,该构象称为热区。热区具有稳定并协调蛋白质与蛋白质相互作用的功能,热区的发现和界定对于理解疾病的起源、生物制药、药物作用靶点等蛋白质活动都非常重要。近年来,研究人员从实验角度出发,记录了一些蛋白质相互作用的数据,但是由于蛋白质相互作用实验成本高、周期长、复杂度高,实验数据相当有限,因此利用计算机的方法预测蛋白质相互作用的热区就显得尤为重要。本文提出一种基于密度聚类和特征分类的蛋白质热区预测模型,实验结果显示,与其他方法相比,所提出的方法可以得到更好的预测结果。并且在热区研究的基础上,提出了一种基于序列保守性的验证热区的方法。研究的主要创新点概括如下:(1)提出了一种基于密度的增量型聚类结合特征分类的预测蛋白质相互作用热区的方法。首先利用基于密度的增量型聚类对数据集里面的数据进行聚类,得到多个初始的聚类簇,然后利用基于特征的分类剔除这些聚类簇中的非热点残基,从而得到最终的预测热区。实验结果显示所提出的方法可以预测出绝大多数的热区,同时在预测热区中热点的覆盖率也高于其他相关方法。(2)提出了一种有效的特征选择的方法。在进行特征分类时,为了有效的选择关键的生物特征,首先从蛋白质结构出发,提取一系列与蛋白质相互作用相关的特征,然后通过基于支持向量机的递归特征消除结合归一化互信息特征选择,利用向后特征淘汰策略得到最重要的特征和去除无关紧要的特征,从而得到一个从最重要到最无关的特征排序列表,最后通过引入F-score找到这些特征的最优化组合。(3)提出了一种基于序列保守性的热区验证方法。由于生物实验的复杂性和长周期性,使得由生物实验验证热区十分困难,这里提出一种基于序列保守性的热区验证方法。对于热区中的每一个热点,在蛋白质数据库中找到形成该复合物的两个蛋白质,通过其可变剪切体得到该基因的完整序列,通过完整的蛋白质序列找到其在不同物种中的直接同源基因,然后进行多序列比对,记录预测热区中每一个热点残基对应到不同物种基因序列中的位点,通过模块替换矩阵构造的蛋白质热区保守性得分函数,得到热区在不同物种中的保守性得分,最后计算每一个热区相对于相互作用界面上其他区域的保守倾向性。
【学位单位】:武汉科技大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:Q51
【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 蛋白质相互作用热区的概念
        1.3.1 蛋白质-蛋白质相互作用
        1.3.2 蛋白质结合面性质
        1.3.3 蛋白质相互作用中的热点残基
        1.3.4 蛋白质相互作用中的热区
    1.4 本文的研究内容与创新点
        1.4.1 本文的内容安排
        1.4.2 本文的创新点
    1.5 本章小结
第2章 蛋白质相互作用的生物实验方法和智能计算方法
    引言
    2.1 获取蛋白质相互作用的生物实验方法
        2.1.1 丙氨酸突变实验
        2.1.2 Bind-Wash-Elute洗脱实验
        2.1.3 高通量实验方法
    2.2 预测蛋白质相互作用的智能计算方法
        2.2.1 基于基因信息的方法
        2.2.2 基于蛋白质结构信息的方法
        2.2.3 基于氨基酸序列信息的方法
    2.3 蛋白质相互作用的数据库
    2.4 本章小结
第3章 基于密度聚类和特征分类的蛋白质热区预测
    引言
    3.1 基于密度的增量型聚类
        3.1.1 聚类分析
        3.1.2 聚类算法分析
        3.1.3 基于蛋白质残基密度的增量型聚类
    3.2 基于特征的分类
        3.2.1 支持向量机
        3.2.2 递归特征消除结合归一化互信息特征选择
    3.3 结合密度聚类和特征分类的热区预测算法
    3.4 实验结果与分析
        3.4.1 数据集
        3.4.2 标准热区定义
        3.4.3 评价准则
        3.4.4 实验结果
        3.4.5 预测性能比较
    3.5 本章小结
第4章 热区预测算法优化
    引言
    4.1 聚类参数选择优化
        4.1.1 蛋白质残基密度聚类参数选择
        4.1.2 聚类参数选择优化算法
        4.1.3 实验结果
        4.1.4 预测性能比较
    4.2 邻居残基优化
        4.2.1 热区预测结果邻居残基优化原则
        4.2.2 邻居残基优化算法
        4.2.3 实验结果
        4.2.4 预测性能比较
    4.3 本章小结
第5章 基于序列保守性的热区验证方法
    引言
    5.1 直接同源基因
    5.2 保守性得分函数
    5.3 实验结果与分析
    5.4 本章小结
第6章 总结与展望
    6.1 本文的主要研究工作
    6.2 下一步工作展望
致谢
参考文献
附录1攻读博士学位期间取得的科研成果
附录2攻读博士学位期间参加的科研项目

【相似文献】

相关期刊论文 前10条

1 梁琳慧,韩忠朝;蛋白质相互作用的研究方法[J];生命的化学;2005年03期

2 唐泽耀,戴淑芳,陈华,林原;蛋白质相互作用研究的哲学思考[J];医学与哲学;2005年01期

3 曹建平,马义才,李亦学,石铁流;计算方法在蛋白质相互作用研究中的应用[J];生命科学;2005年01期

4 谢江;张武;梅健;顾知立;吴继宗;李辉;张律文;;一种新的计算预测alpha-synuclein蛋白质相互作用网络的方法(英文)[J];Journal of Shanghai University(English Edition);2008年06期

5 余鑫煜;许正平;;蛋白质相互作用数据库及其应用[J];中国生物化学与分子生物学报;2008年03期

6 刘中扬;李栋;朱云平;贺福初;;蛋白质相互作用网络进化分析研究进展[J];生物化学与生物物理进展;2009年01期

7 王正华;董蕴源;王勇献;;蛋白质相互作用网络的几种聚类方法综述[J];国防科技大学学报;2009年04期

8 陆林英;魏雅卓;崔颖;孙平平;马雅楠;马志强;;基于支持向量机的蛋白质相互作用识别[J];生物信息学;2009年04期

9 王建新;蔡钊;李敏;;一种基于极大团的蛋白质相互作用预测方法[J];高技术通讯;2009年01期

10 李松倍;谢江;张武;武频;;蛋白质相互作用网络的相似子网搜索问题研究[J];计算机工程与应用;2010年03期


相关博士学位论文 前10条

1 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年

2 梁治;蛋白质相互作用网络的比较生物学分析及其应用[D];中国科学技术大学;2006年

3 王晓敏;基于蛋白质相互作用网络的功能模块识别及功能预测研究[D];国防科学技术大学;2013年

4 胡静;基于密度聚类和特征分类的蛋白质相互作用热区预测[D];武汉科技大学;2015年

5 谢江;蛋白质相互作用网络的数值研究[D];上海大学;2008年

6 史明光;蛋白质相互作用预测方法的研究[D];中国科学技术大学;2009年

7 杜秀全;基于智能计算的蛋白质相互作用预测方法研究[D];安徽大学;2010年

8 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年

9 庞开放;基于基因表达和蛋白质相互作用数据集成的蛋白质进化、功能重要性和动态模块化组织的研究[D];上海交通大学;2011年

10 冯铁男;基于小波的蛋白质相互作用网络的研究[D];上海大学;2011年


相关硕士学位论文 前10条

1 董蕴源;基于谱方法的蛋白质相互作用网络分析[D];国防科学技术大学;2007年

2 邴志桐;蛋白质相互作用网络度分布的研究[D];兰州大学;2009年

3 杨晓飞;基于多源数据融合的蛋白质—蛋白质相互作用网络构建方法研究[D];中国科学技术大学;2009年

4 刘喆;人类蛋白质相互作用数据库可靠性的衡量[D];天津大学;2009年

5 李满生;基于本体的蛋白质相互作用信息文本挖掘方法研究[D];中国人民解放军军事医学科学院;2010年

6 毕敬业;基于序列的蛋白质相互作用预测方法研究[D];山西大学;2013年

7 步淑杰;基于非变性微型2DE-网格凝胶切取—定量LC-MS/MS蛋白质相互作用组学方法的建立及人类血浆蛋白质的分析[D];华南理工大学;2015年

8 庄雪琴;大图理论在蛋白质相互作用网络比对中的应用[D];南京理工大学;2015年

9 陈白雪;体外进化ATP结合蛋白的初步功能研究[D];华中农业大学;2015年

10 董美豪;基于文本挖掘的蛋白质相互作用对抽取方法的研究[D];哈尔滨工业大学;2015年



本文编号:2838876

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/2838876.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6ebc2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com