化合物血浆蛋白结合率和内分泌干扰性的计算机预测研究
发布时间:2020-06-15 15:45
【摘要】:不良的 ADMET(Absorption,Distribution,Metabolism,Excretion,and Toxicity)性质是药物研发失败的重要原因,随着化学合成和生物筛选能力的飞速提高,大量化合物急需进行早期ADMET性质研究,许多中、高通量的体外测试技术应运而生。而计算机预测作为一类更加高效与经济的技术可以显著提高化合物ADMET性质研究的能力,加快药物研发的进程。本论文旨在利用机器学习方法预测化合物的血浆蛋白结合率和内分泌干扰特性,主要内容如下所述。第一章详细介绍了课题研究中使用的定量/定性构效关系(Quantitative/Qualitative Structure-Activity Relationship,QSAR)方法的研究过程,包括数据处理、分子结构表征、(定量、单标签及多标签分类)模型构建的常用机器学习方法和模型评价等。血浆蛋白结合率作为一个重要的药代动力学和毒代动力学性质在药物研究中具有重要的意义,因此,在论文的第二章我们构建了化合物血浆蛋白结合率的预测模型。该研究首先收集得到了一个由967个药物分子构成的训练集,然后结合6种机器学习算法和26个分子描述符构建了回归模型,用于预测化合物的血浆蛋白结合分数。我们还使用两种一致性策略构建了组合模型,结果表明一致性模型相比单个模型存在一定的优势。所有的模型通过内部10折交叉验证和三个多样的外部测试集进行验证与评估,其中三个测试集分别由242个药物分子、397个环境化合物和231个新设计的分子构成,模型对整个测试集预测的平均绝对误差(Mean Absolute Error,MAE)范围是0.126到0.178。本研究中我们根据不同的实验测试技术获得的数据分析了实验误差近似为0.061,此外考虑到结合率0-1的范围,0.126到0.178的误差表明我们的模型获得了合理的可靠性。最后,我们对影响血浆蛋白结合的关键分子描述符进行了分析,从而可以辅助模型的解释;同时还定义了模型的应用域,这将有助于模型的合理使用。化合物内分泌干扰性已成为一个严重的公共健康问题,也是药物毒副作用的一种,因此对广泛应用中的化合物进行内分泌干扰特性预测研究具有重要的意义。为此我们在论文的第三章构建了化合物内分泌干扰性的预测模型。首先我们从Tox21收集了 6个内分泌相关靶标的调节剂数据,通过整合获得了一个分别由294个和73个分子构成的多标签训练集和测试集,同时为每个靶标分别整合了一个单标签训练集和测试集,然后我们分别构建了多靶标单标签和多标签模型用于预测化合物的内分泌干扰特性。为了处理数据不平衡问题,我们使用多次随机欠采样结合投票分类的策略,为每个靶标分别构建单标签模型,然后我们结合5种多标签分类方法和12种指纹构建多标签模型。结果表明,所有靶标的单标签模型都获得了合理的可靠度,而多标签模型中Label Powerset这种能够考虑到靶标之间相互作用关系的算法结果最好。此外为了便于比较和分析,我们将每个靶标的最好的单标签模型组合起来以获得多标签预测,结果表明多标签模型的预测准确度相比组合最优的单标签模型存在显著的优势。研究发现传统的单标签模型对具有“多标签”特性的阴性样本预测易为假阳,而多标签模型能够很好地弥补这一缺陷。所以我们的研究说明,通过多标签建模策略,利用所研究靶标之间的相互作用关系,可以提升内分泌干扰物预测模型的准确度。最后一章为全文总结。
【学位授予单位】:华东理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP181;R96
【图文】:
1.2计算毒理学逡逑毒理学是一门研宄外界环境中的化合物进入机体后对机体产生危害及其作用机制逡逑的一门学科,为保护生物体的安全和环境生态系统的平衡提供了科学依据。一些可能对逡逑机体产生损伤作用的外来物质在日常生活中无处不见,包括生活中的日用品、化妆品、逡逑食物添加剂、药品、农药、各种环境污染物和工业化学物质(如灭火器中的阻燃剂、塑逡逑料制品中的增塑剂)等。而大多数化合物缺乏全面的安全性评价[14],所以需要加快对它逡逑们进行毒理学研宄,以及时阻止有害物质的继续使用,保障生物体的健康和安全。长期逡逑以来毒理学研究的主要方法是动物实验,但动物研宄成本高、费时费力且违背动物保护逡逑伦理,所以依据欧盟的邋REACH邋(Registration,Evaluation,Airthorization邋and邋Restriction邋of逡逑Chemicals)要求研究者应该逐渐减少实验动物的使用,转而借助一些更加快捷且逡逑经济的体外测试或计算方法。随着高通量技术的广泛应用,体外毒性测试方法也得到了逡逑发展。计算毒理学就是使用计算方法进行化合物的毒性预测,它是体外和体内毒性分析逡逑方法的补充,可以用于化合物的筛选、指导毒性测试、减少后期研宄的失败率。当前,逡逑基于计算的毒理学研宄方法主要有4种即:逡逑(1)定量/定性构效关系[16]邋(Quantitative/邋Qualitative邋Structure-Activity邋Relationship,逡逑
确度不会超过建模所用实验数据的精确度,所以如性差异(或单个数据集实验误差大于30%),我们该数据),因为这种情况下构建的模型是不可靠的件能够进行上述操作,比如ChemAxon[271邋(学术ent^28](商业)、RDKit邋program邋tools[29](免费)、LKNIME[31](免费)、PipelinePilot[32](商业)等。便捷,人工干预依然必不可少。对于成千上万条记数据进行核对,或者仅仅核对结构比较复杂的化合,每一个分子都可以获得其正确的结构,而其活性以通过构建一致性模型,将那些被所有模型都预测方法已被成功应用于Ames邋mutagenicity研究中[24]疑分子进行文献验证,发现其中31个(?22.2%)测的方法可以用来提高活性数据质量。逡逑
【学位授予单位】:华东理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP181;R96
【图文】:
1.2计算毒理学逡逑毒理学是一门研宄外界环境中的化合物进入机体后对机体产生危害及其作用机制逡逑的一门学科,为保护生物体的安全和环境生态系统的平衡提供了科学依据。一些可能对逡逑机体产生损伤作用的外来物质在日常生活中无处不见,包括生活中的日用品、化妆品、逡逑食物添加剂、药品、农药、各种环境污染物和工业化学物质(如灭火器中的阻燃剂、塑逡逑料制品中的增塑剂)等。而大多数化合物缺乏全面的安全性评价[14],所以需要加快对它逡逑们进行毒理学研宄,以及时阻止有害物质的继续使用,保障生物体的健康和安全。长期逡逑以来毒理学研究的主要方法是动物实验,但动物研宄成本高、费时费力且违背动物保护逡逑伦理,所以依据欧盟的邋REACH邋(Registration,Evaluation,Airthorization邋and邋Restriction邋of逡逑Chemicals)要求研究者应该逐渐减少实验动物的使用,转而借助一些更加快捷且逡逑经济的体外测试或计算方法。随着高通量技术的广泛应用,体外毒性测试方法也得到了逡逑发展。计算毒理学就是使用计算方法进行化合物的毒性预测,它是体外和体内毒性分析逡逑方法的补充,可以用于化合物的筛选、指导毒性测试、减少后期研宄的失败率。当前,逡逑基于计算的毒理学研宄方法主要有4种即:逡逑(1)定量/定性构效关系[16]邋(Quantitative/邋Qualitative邋Structure-Activity邋Relationship,逡逑
确度不会超过建模所用实验数据的精确度,所以如性差异(或单个数据集实验误差大于30%),我们该数据),因为这种情况下构建的模型是不可靠的件能够进行上述操作,比如ChemAxon[271邋(学术ent^28](商业)、RDKit邋program邋tools[29](免费)、LKNIME[31](免费)、PipelinePilot[32](商业)等。便捷,人工干预依然必不可少。对于成千上万条记数据进行核对,或者仅仅核对结构比较复杂的化合,每一个分子都可以获得其正确的结构,而其活性以通过构建一致性模型,将那些被所有模型都预测方法已被成功应用于Ames邋mutagenicity研究中[24]疑分子进行文献验证,发现其中31个(?22.2%)测的方法可以用来提高活性数据质量。逡逑
【相似文献】
相关期刊论文 前10条
1 王廷廷;;农药专利化合物的前世今生[J];农药市场信息;2016年28期
2 王辉;Ponmani Jeyakkumar;Sangaraiah Nagarajan;孟江平;周成合;;傒类化合物研究与应用[J];化学进展;2015年06期
3 童建军;;非金属及其化合物相关新型试题易错提醒[J];中学生数理化(高一版);2015年11期
4 ;FEMA公布的第26批GRAS化合物名单[J];香料香精化妆品;2013年05期
5 沈英;;一种新型二乙酰氨乙酸乙二胺化合物及其药物组合物[J];乙醛醋酸化工;2013年06期
6 ;更正[J];徐州师范大学学报(自然科学版);2009年02期
7 陈仕玉;胡建辉;王晓艳;杨景周;;硅钼间化合物的研究及应用[J];山东陶瓷;2007年02期
8 池n 一也;坂gq 恒;^兲
本文编号:2714641
本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/2714641.html
最近更新
教材专著