抗氧化剂分子数据库建立及其QSAR分析
发布时间:2020-05-12 12:36
【摘要】:自由基攻击几乎所有类型的生物化学物质,如脂质,蛋白质,DNA等,这些都是自由基链式反应。过量的人体内自由基导致氧化应激,会导致各种类型的全身性疾病的发展。传统抗氧化剂的筛选方法需要耗费较大的人力物力。因此亟需建立具有统计学意义和预测能力的QSAR模型,进而快速、准确地预测筛选化合物的抗氧化剂活性。本研究的目的是建立一个高质量的体外抗氧化剂数据库,并且据此综合运用化学信息学原理建立稳定可靠的QSAR模型,建立化合物清除DPPH自由基的能力与相应的结构特征间的定量构效关系模型来预测化合物的抗氧化活性。用于筛选新的潜在抗氧化剂。从PubChem数据库和文献中收集了具有抗氧化活性的化合物,并且通过去除重复值、无机物和离散值,保留799种化合物的完整antioxidantsDB数据库,该数据库中抗氧化剂分子的pIC50活性值从3.2到5.5,logP(o/w)辛醇/水分配系数范围-4.5~20.3,抗氧化剂的分子的量范围110~2809.9 g/mol。数据库中天然来源的抗氧化剂化合物占37.3%。分子量在200到600 g/mol之间,logP(o/w)在0到5之间包含的抗氧化剂分子最多。合成的抗氧化剂大多都是亲脂性的。天然的抗氧化剂分子量较大。antioxidantsDB中主要的化合物类别为苯并咪唑衍生物、香豆素衍生物、吡唑衍生物、吡啶衍生物、噻唑衍生物等。数据库中包含的物理化学、生物活性信息,如官能团、抗氧化活性区间、分子量、氢键供体、氢键受体和分子类型,有助于全面深入了解抗氧化剂分子。通过该数据库,可以进行化合物的相似性搜索,结构搜索等基于特征的查询,同时使用数据库方便研究者快速了解抗氧化剂目前研究现状,以便进一步进行数据分析与预测。在QSAR的开发过程中,分子描述符作为活性和小分子结构的桥梁,是QSAR分析的基础。使用MOE软件生成2D和3D分子描述符一共有322个。其中不相关的冗余描述符会影响预测精度。通过PCA和共线性分析去除和抗氧化活性不相关的描述符有300个,保留了重要的22个描述符为PEOE_VSA-3、vsurf_CW8、E_sol、a_don、vsurf_HB8、SlogP_VSA0、h_pKa等。基于22个分子描述符,采用PLS、SWR-MLR、SVR、RF、kNN算法建立了五种QSAR模型。通过训练集内部10折交叉验证,Q~2均大于0.64、RMSE_(cv)均小于0.23,对于测试集模型的表现R~2均大于0.67,RMSE均小于0.22。模型具有良好的拟合性和预测性。RF模型的内部10折交叉验证有最好的效果Q~2等于0.70,RMSEcv为0.20。对于测试集kNN模型的预测能力最好R~2等于0.74,RMSE等于0.19。开发的模型具备预测能力,可以用于预测一组化合物的抗氧化活性,模型的预测结果和实验值相关系数均大于0.5。其中PLS模型对这组包含实验值的外部验证集预测效果最好R等于0.63。通过本项目的研究,建立了数据库,提供了采用化学信息学原理进行抗氧化物研究的基础,通过化学信息学原理和方法进一步促进抗氧化物的研究和筛选。尽管我们尽了最大的努力,antioxidantsDB并不是所有抗氧化剂分子的详尽存储库。在未来,我们打算增加抗氧化剂分子的覆盖面,并寻找它们对人类健康的潜在影响。我们将继续增加抗氧化剂分子数据库的覆盖面,增加模型预测能力,并进行抗氧化剂人类健康的潜在影响的研究。为了获得更多关于抗氧化能力的物理化学决定因素的信息,扩展我们已知的抗氧化剂分子的化学空间是值得的。
【图文】:
东北农业大学工程硕士学位论文果与分析抗氧化剂数据库据库的建立涉及数据清理 数据集成和数据变换,,它也是数据挖掘的一个重要骤 抗氧化剂数据库结构见图 3-1,在 antioxidantsDB 数据库包含 4 个数据表(antioxiptors 2D descriptor 3D bioassay),antioxidantsDB 中 antioxidants 是主表并提供特性的信息 不同的化合物标识(Canonical Smile CAS registry number Chemica抗氧化活性参考值 IC50,以及参考文献和抗氧化剂分子的来源 descriptorsiptors 3D 副表中包含将抗氧化剂活性分子化学结构进行编码转化成描述符 Bioa含各种生物活性测定的试验数据 将数据汇编到一个数据库中,并分析数据的变异研究中使用的所有化合物的结构进行了整理以除去错误,并标准化为统一表示 和检索数据有不同的选项 首先,可以通过名称,物理化学特性或诸如抗氧化的数据 允许快速和容易地选择一组抗氧化剂分子 最后,根据性质选择不同类别的提供一种快速访问不同类别抗氧化剂的简便方法
品添加剂通用标准 CAC 的食品添加剂被认为适合在食品中使用 符合 CAC 标准的抗共有 35 钟 与本文数据库有 11 个重叠化合物 CAC 标准中抗氧化剂有些盐类化合坏血酸钙 乳酸钾 抗坏血酸钠 异抗坏血酸钠 乳酸钠 焦亚硫酸钠 亚硫酸钾本文研究的范围内 本文研究的是抗坏血酸 异抗坏血酸等有机物 并且由于我们的生成软件不能区分立体异构体,因此它们将被认为具有与其母体化合物相同的化学结东北农业大学工程硕士学位论文
【学位授予单位】:东北农业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q503
本文编号:2660233
【图文】:
东北农业大学工程硕士学位论文果与分析抗氧化剂数据库据库的建立涉及数据清理 数据集成和数据变换,,它也是数据挖掘的一个重要骤 抗氧化剂数据库结构见图 3-1,在 antioxidantsDB 数据库包含 4 个数据表(antioxiptors 2D descriptor 3D bioassay),antioxidantsDB 中 antioxidants 是主表并提供特性的信息 不同的化合物标识(Canonical Smile CAS registry number Chemica抗氧化活性参考值 IC50,以及参考文献和抗氧化剂分子的来源 descriptorsiptors 3D 副表中包含将抗氧化剂活性分子化学结构进行编码转化成描述符 Bioa含各种生物活性测定的试验数据 将数据汇编到一个数据库中,并分析数据的变异研究中使用的所有化合物的结构进行了整理以除去错误,并标准化为统一表示 和检索数据有不同的选项 首先,可以通过名称,物理化学特性或诸如抗氧化的数据 允许快速和容易地选择一组抗氧化剂分子 最后,根据性质选择不同类别的提供一种快速访问不同类别抗氧化剂的简便方法
品添加剂通用标准 CAC 的食品添加剂被认为适合在食品中使用 符合 CAC 标准的抗共有 35 钟 与本文数据库有 11 个重叠化合物 CAC 标准中抗氧化剂有些盐类化合坏血酸钙 乳酸钾 抗坏血酸钠 异抗坏血酸钠 乳酸钠 焦亚硫酸钠 亚硫酸钾本文研究的范围内 本文研究的是抗坏血酸 异抗坏血酸等有机物 并且由于我们的生成软件不能区分立体异构体,因此它们将被认为具有与其母体化合物相同的化学结东北农业大学工程硕士学位论文
【学位授予单位】:东北农业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q503
【参考文献】
相关期刊论文 前2条
1 王婷;;定量结构-活性关系的研究方法及其应用[J];科技视界;2014年15期
2 孙玉敬;叶兴乾;;定量构效关系在食品科学中的研究进展[J];中国食品学报;2010年05期
本文编号:2660233
本文链接:https://www.wllwen.com/projectlw/swxlw/2660233.html