当前位置:主页 > 理工论文 > 生物学论文 >

基于深度学习的蛋白质—配体结合残基预测

发布时间:2020-05-27 02:18
【摘要】:随着人类基因组计划测序工作完成,蛋白质的相关研究已成为当今生命科学的主要研究内容之一。配体结合蛋白在诸多生物过程中发挥关键作用。蛋白质-配体结合残基的识别对于理解蛋白质功能有重要意义。由于传统测定方法的技术细节复杂且成本高昂,处理海量的蛋白质需要计算方法的参与。已知的计算方法均基于传统机器学习,可被粗略地分为基于序列的方法和基于三维结构的方法,两者的根本区别在于是否使用三维结构,前者已在一系列结合残基预测任务中胜过后者。然而,已知的蛋白质序列在数量上远远超过已知的蛋白质三维结构,随着深度学习技术的发展,基于序列的方法有相当可观的提升空间。因此,有必要对基于深度学习的蛋白质-配体结合残基预测开展研究。本文的主要工作及贡献如下:·提出了一种基于深度学习的蛋白质-配体结合残基预测方法。该方法(Deepsi)仅使用了序列信息,所用特征共计7类,分别为位置特异性打分矩阵、溶剂可及性、蛋白质二级结构、二面角、保守性、残基氨基酸类型和位置编码。Deepsi可处理变长序列,其深度网络采用了全卷积架构,主要由不同规格的卷积层堆叠而成,特征最终由一组1×1卷积核整合并由softmax归一化得到所有残基关于结合残基的概率分布。隐层表示的有效上下文范围随层数的增长而扩大,大范围有效上下文能够捕捉两个残基之间的长距离依赖,通过调整层数和卷积核大小可精确控制依赖的最大距离。目前已知的最优方法COACH及其部分子方法被选为实验基准。测试实验在一个基本测试集和三个扩展测试集上进行,其中基本测试集包含151条非冗余蛋白质。实验表明Deepsi无需依赖任何采样手段即可在严重倾斜的训练集上正常拟合并获取良好的泛化性能,其MCC和精确率相对于基准模型的提升分别不低于0.05和16%。·在结合残基聚集性的基础上提出了另一种基于深度学习的蛋白质-配体结合残基预测方法。该方法(i Deepsi)使用的特征与Deepsi相同。由于结合残基的位置分布表现出聚集性,i Deepsi在原有深度网络中增加了新模块,从上下文标签或预测结果中提取特征。i Deepsi通过改变其深度网络的前向传播机制提高了其在测试过程和生产环境中的并行度。i Deepsi与Deepsi共用所有数据集,同样可在严重倾斜的训练集上正常拟合。实验表明i Deepsi相对于基准模型在MCC和精确率方面的提升分别不低于0.07和19%。在不使用包括三维结构在内的任何模板的前提下,Deepsi和i Deepsi在性能上相对于已提出的各类方法均有显著提升,包括最具代表性的COACH。此外,本文还讨论了一种训练集增量化方案,其略微提高了预测性能。
【图文】:

过程图,卷积运算,卷积核,过程


x + (2.1)其中 W 表示卷积核的权值矩阵, 表示偏置项。二维卷积是最为常见的卷积运算,以大小为 3 3 的输入 和一个 2 2 的卷积核为例,输出张量的计算过程如图2.5所示。11
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;Q811.4

【相似文献】

相关期刊论文 前10条

1 王琼;郭金华;;CYP3A4的配体结合机制[J];国外医学(药学分册);2007年03期

2 任均田,李振甲;配体结合分析的某些进展[J];国外医学.临床生物化学与检验学分册;1986年04期

3 王磊;程昊;倪莹宙;梁丽;;基于β-乳球蛋白配体结合特性的活性成分包埋和保护研究现状[J];中国食品学报;2015年04期

4 胡秀珍;刘星星;;酶蛋白质β-发夹模体配体结合位点的统计分析及预测[J];内蒙古工业大学学报(自然科学版);2011年03期

5 姚佳,张祖辉,刘秉文,张敏;不同种属动物肝细胞膜载脂蛋白CⅢ受体的放射性配体结合分析[J];华西医科大学学报;2002年04期

6 赵建勇;高闪电;独军政;常惠芸;;整联蛋白与其配体结合的分子机制研究进展[J];生物技术通讯;2008年06期

7 任均田,张弛 ,林祥通;配体结合分析的某些进展[J];国外医学(放射医学分册);1985年02期

8 武婕,张宏斌,王捷,郑文岭,王清明,陈惠鹏;用噬菌体展示技术分析G-CSF受体的配体结合位点[J];广东医学;2003年03期

9 张君;金亚;叶燕锐;谭文;;G蛋白偶联受体配体结合分析技术[J];药物分析杂志;2015年01期

10 袁成福;;pGenesil-1-MCHR2-shRNA对MCHR2与其放射性配体结合的影响[J];湖北民族学院学报(医学版);2007年04期

相关会议论文 前10条

1 樊迪;刘振明;金宏威;张亮仁;张礼和;;基于配体结合模式的辅酶A结合蛋白的分类方法研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年

2 王文宁;翁经纬;张明杰;;PSD-95-PDZ12的动力学性质及其对配体结合的调节[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年

3 饶立;池波;魏林;任彦亮;万坚;徐昕;;DOX:准确计算预测蛋白-配体结合构象的新方法[A];第十三届全国量子化学会议论文集——第四分会:生命、药物和材料量子化学[C];2017年

4 饶立;池波;魏林;任彦亮;万坚;徐昕;;DOX:准确计算预测蛋白-配体结合构象的新方法[A];第十届全国化学生物学学术会议报告摘要集[C];2017年

5 陈海峰;;天然无规蛋白在配体结合下的折叠机制[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年

6 饶立;万坚;徐昕;;基于XO复合计算化学方法和密度泛函理论计算蛋白-配体结合能[A];中国化学会第30届学术年会摘要集-第十八分会:电子结构理论方法的发展与应用[C];2016年

7 郭晨云;廉艳东;高红昌;林东海;;小鼠附睾特异表达蛋白Lcn6的重组制备及其配体结合特性的研究[A];第十五届全国波谱学学术会议论文摘要集[C];2008年

8 代春月;刘文平;方颖;吴建华;;IL-8介导的CXCR1激活机制的研究[A];第十一届全国生物力学学术会议暨第十三届全国生物流变学学术会议会议论文摘要汇编[C];2015年

9 池波;饶立;万坚;徐昕;;DOX预测生物大分子与配体结合构象研究的新进展[A];中国化学会第30届学术年会摘要集-第二十五分会:化学信息学与化学计量学[C];2016年

10 郭军庆;李青梅;乔松林;王丽;张改平;;牛IgG Fc受体Ⅱ线性配体结合表位的分析鉴定[A];第九届全国免疫学学术大会论文集[C];2014年

相关博士学位论文 前6条

1 池波;DOX:准确预测蛋白-配体结合构象的计算新方法[D];华中师范大学;2017年

2 刘笑;蛋白配体结合自由能精确理论计算新方法研究[D];华东师范大学;2018年

3 余长缨;Ⅰ.PPARγ与小分子以及相关受体蛋白的相互作用研究 Ⅱ. SARS冠状病毒刺突蛋白免疫片段的热力学和动力学研究[D];中国海洋大学;2004年

4 李伟;蛋白质配体结合位点柔性的系统分析及分子柔性对接方法的发展和应用[D];北京协和医学院;2012年

5 杨曦;人Fcα/μR配体结合位点研究[D];北京协和医学院;2012年

6 林昕;基于活性探针分子对代谢型γ-氨基丁酸受体激活机制的研究[D];华中科技大学;2012年

相关硕士学位论文 前10条

1 崔屹峰;基于深度学习的蛋白质—配体结合残基预测[D];华东师范大学;2019年

2 格日勒图;蛋白质中五种配体结合残基的识别[D];内蒙古工业大学;2016年

3 朱彦彩;鸡传染性法氏囊病病毒VP2蛋白配体结合表位的鉴定[D];河南农业大学;2008年

4 刘岩;大螟两个气味结合蛋白基因的体外表达及配体结合能力分析[D];南京农业大学;2015年

5 魏丹;二化螟气味结合蛋白的基因克隆、组织分布及配体结合能力分析[D];南京农业大学;2013年

6 张婷;甜菜夜蛾气味结合蛋白的基因克隆、组织分布及配体结合能力分析[D];南京农业大学;2012年

7 张利娜;小鼠FcγRIII线性配体结合表位的鉴定[D];中国农业科学院;2009年

8 赵树鑫;配体结合对G蛋白力学性能影响的研究[D];燕山大学;2016年

9 康文渊;芳香烃受体—配基互作模式的分子动力学模拟[D];西南交通大学;2017年

10 张馨月;Sdr家族成员Bbp的配体结合与结构研究[D];清华大学;2015年



本文编号:2682790

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2682790.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4a510***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com