肽结构表征及统计建模方法学研究与应用
发布时间:2022-01-03 17:29
肽作为一种极为重要的生物活性物质,它在诸多生理和生化过程中扮演着中心角色。统计学方法研究肽的结构与功能关系需要解决分子结构表征和统计建模两方面问题。本文以此为入手点,通过提出、改进、引入和比较一系列表征方法和建模工具对肽的统计模拟方法学进行了系统研究。在肽的结构表征方面,本文在三个层次开展了探索工作:①定义了用于描述肽组成残基单元的氨基酸理化性质归类得分(DPPS)和拓扑标度(T标度),是为第一层次的单元参数化方法。②提出了用于表征不等长肽序列氨基酸组成及其交互信息的氨基酸组成/环境作用描述子(ACD/EID)系统,是为第二层次的序列参数化方法。③设计了基于自洽平均场理论/旋转异构子库的侧链构象分析(SCSA)方法和量子力学/分子力学-泊松波尔兹曼/表面加和模型(QM/MM-PB/SA)组合策略用于分析处于复合状态的肽/蛋白质结合自由能,是为第三层次的结构参数化方法。在肽的统计建模方面,本文主要做了以下几点工作:①新方法的应用:首次将新型机器学习算法高斯过程(GP)和随机森林(RF)应用到肽的统计模拟领域,探讨了它们与传统建模方法的性能差异。②新方法的提出:将遗传算法(GA)用于GP变...
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:204 页
【学位级别】:博士
【部分图文】:
虚拟筛选FimC/FimH复合物抑制剂的流程
图 2.1 免疫神经网络的算法流程Fig. 2.1 Algorithmic flow of immune neural network2.1.4 免疫神经网络人工神经网络(neural network, NN)是一种通过模拟生物神经信号处理系统而发展起来的机器学习方法,它被广泛用于模式识别、函数拟合、过程控制、图形映射等众多领域。自从九十年代初 Aoyama 等首次应用 NN 对碳苯醌类衍生物进行[110]
而抗原肽则嵌于其中,呈舒展状态。图 4.2(b)为从复合物中剥离出的抗原肽分子立体结构,该分子的所有残基皆为反式构象,从而使得侧链间距达到最大,并未出现明显扭曲现象。通过上述分析可知处于结合状态的抗原肽立体结构受到 HLA-A*0201 分子影响较小,位于近似低能构象,而决定抗原肽与HLA-A*0201 结合强弱的关键在于抗原肽残基与附近 HLA-A*0201 残基的作用大小,其自身残基间相互影响较弱。由于受体蛋白质 HLA-A*0201 可以认为是不变的,因而抗原肽序列各个位置残基的差异导致了它们之间亲和活性的不同。Golbraikh 等研究结果显示,交叉检验 q2值的大小与模型预测能力并没有明显直接关系,对模型预测能力的评价只能通过外部样本集即测试集来进行[116]。为了便于比较,按照 Doytchinova 等的方案将 152 个抗原肽样本集随机划分为一个包含102 个样本的训练集和一个包含 50 个样本的测试集[78],并使用测试集对训练集所建模型进行验证(测试集样本在表 4.2 中编号为 103–152)。其中测试集样本满足内插值原则:①抗原肽序列每个位点上氨基酸残基类型在训练集样本中同一位点处出现过;②抗原肽亲和活性不为最大或最小值。
【参考文献】:
期刊论文
[1]一种基于遗传算法的肽/蛋白质结合模式虚拟筛选建模技术[J]. 周鹏,田菲菲,李波,吴世容,李志良. 化学学报. 2006(07)
[2]一种新的氨基酸描述子及其在肽QSAR中的应用[J]. 梅虎,周原,孙立力,李志良. 物理化学学报. 2004(08)
[3]免疫算法[J]. 王磊,潘进,焦李成. 电子学报. 2000(07)
硕士论文
[1]定量序效模拟[D]. 周鹏.重庆大学 2007
本文编号:3566679
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:204 页
【学位级别】:博士
【部分图文】:
虚拟筛选FimC/FimH复合物抑制剂的流程
图 2.1 免疫神经网络的算法流程Fig. 2.1 Algorithmic flow of immune neural network2.1.4 免疫神经网络人工神经网络(neural network, NN)是一种通过模拟生物神经信号处理系统而发展起来的机器学习方法,它被广泛用于模式识别、函数拟合、过程控制、图形映射等众多领域。自从九十年代初 Aoyama 等首次应用 NN 对碳苯醌类衍生物进行[110]
而抗原肽则嵌于其中,呈舒展状态。图 4.2(b)为从复合物中剥离出的抗原肽分子立体结构,该分子的所有残基皆为反式构象,从而使得侧链间距达到最大,并未出现明显扭曲现象。通过上述分析可知处于结合状态的抗原肽立体结构受到 HLA-A*0201 分子影响较小,位于近似低能构象,而决定抗原肽与HLA-A*0201 结合强弱的关键在于抗原肽残基与附近 HLA-A*0201 残基的作用大小,其自身残基间相互影响较弱。由于受体蛋白质 HLA-A*0201 可以认为是不变的,因而抗原肽序列各个位置残基的差异导致了它们之间亲和活性的不同。Golbraikh 等研究结果显示,交叉检验 q2值的大小与模型预测能力并没有明显直接关系,对模型预测能力的评价只能通过外部样本集即测试集来进行[116]。为了便于比较,按照 Doytchinova 等的方案将 152 个抗原肽样本集随机划分为一个包含102 个样本的训练集和一个包含 50 个样本的测试集[78],并使用测试集对训练集所建模型进行验证(测试集样本在表 4.2 中编号为 103–152)。其中测试集样本满足内插值原则:①抗原肽序列每个位点上氨基酸残基类型在训练集样本中同一位点处出现过;②抗原肽亲和活性不为最大或最小值。
【参考文献】:
期刊论文
[1]一种基于遗传算法的肽/蛋白质结合模式虚拟筛选建模技术[J]. 周鹏,田菲菲,李波,吴世容,李志良. 化学学报. 2006(07)
[2]一种新的氨基酸描述子及其在肽QSAR中的应用[J]. 梅虎,周原,孙立力,李志良. 物理化学学报. 2004(08)
[3]免疫算法[J]. 王磊,潘进,焦李成. 电子学报. 2000(07)
硕士论文
[1]定量序效模拟[D]. 周鹏.重庆大学 2007
本文编号:3566679
本文链接:https://www.wllwen.com/yixuelunwen/swyx/3566679.html