部分有机物致敏性及其极性参数的QSPR研究
发布时间:2018-10-04 22:14
【摘要】:随着现代工业的不断发展,人类生产生活等各方面也受到了一些影响,有些有机化合物对人类身体健康会造成一定的危害,因此人们越来越关注有机化合物对人体造成的影响,也就进一步促进了对有机化合物性质的研究。为了更好的对有机化合物的一些性质进行研究,同时减少动物实验造成的一些不良后果以及节省对时间和金钱的消耗,采用定量构效关系对有机化合物的性质进行研究显得很有必要。在建立模型预测化合物性质的过程中,将K-最近邻(KNN:K-nearest neighbor)、K均值聚类(KMC:K-means clustering)以及投影寻踪(PP:Projection Pursuit)三种分类方法和建模方法有效的结合,对部分有机化合物的致敏性和部分有机化合物的极性参数进行定量结构性质相关(QSPR:Quantitative Structure-Property Relationship)的研究。本文中主要研究包括:(1)KNN、K均值聚类法和投影寻踪三种分类方法对有机物致敏性进行QSPR研究:文中从数据库NTP(National Toxicology Program)中收集筛选出小鼠局部淋巴结实验(local lymph node assay,LLNA)186个具有相同载体的致敏性有机化合物的致敏性信息作为研究样本,运用软件ADMEWORKS Model Builder计算和挑选描述符,然后对挑选出来的描述符进行相对标准偏差的计算,最后筛选出7个结构描述符作为样本研究的结构参量。将186个样本应用稳健诊断方法进行奇异值的剔除后剩余118个样本,采用K-最近邻、K均值聚类及投影寻踪三种分类方法对118个样本进行分类,对分类得到的每一类样本运用球排除算法进行训练集和测试集的划分,最后应用多元线性回归(MLR:Multiple Linear Regression),偏最小二乘法(PLS:Partial Least Square)以及人工神经网络(ANN:Artificial Neural Networks)三种建模方法对样本进行预测。(2)KNN、K均值聚类和投影寻踪三种分类方法对有机物极性参数进行QSPR研究:结合从文献中选择出的250个有机物极性参数的样本数据,运用软件ADMEWORKS ModelBuilder计算筛选出7个结构描述符作为样本研究的结构参量。将250个样本应用稳健诊断方法进行奇异值的剔除后剩余225个样本,采用投影寻踪、K-最近邻以及K均值聚类三种分来方法对225个样本进行分类,对分类得到的每一类样本运用球排除算法进行训练集和测试集的划分,最后应用三种建模方法对样本进行预测。(3)文中利用化合物的结构相似度公式:cosθ=α·β/‖α‖·‖β‖,α和β分别代表两个样本的结构描述符向量,‖α‖和‖β‖代表向量范数。相对标准偏差的公式为:RSD=(?)×100%,SD代表标准偏差。采用结构相似度公式和相对标准偏差公式对有机物的致敏性和有机物的极性参数进行结构相似度和结构相似度的相对标准偏差的计算。通过对比用于建模的化合物的结构相似度以及相对标准偏差,来判断化合物结构相似度对建模结果的影响。(4)采用三种分分类方法对样本进行分类后,通过三种建模方法分别对样本进行建模预测,将建模预测出来的结果和实验值用公式(Error=(∑(value_(pre)-value_(exp))~2)/N)计算两组数据的误差。这样可以更为准确的直观的描述预测结果。有效地对比三种分类方法和三种建模方法的优劣。根据以上QSPR的研究结果表明,三种分类方法都可以有效的改善模型的对有机物的致敏性样本和有机物的极性参数样本的预测。KNN和K均值聚类分类后会出现一类预测结果较好而另一类预测结果相对较差,而投影寻踪分类之后的样本化合物的预测结果均比未分类的化合物的预测结果好。从预测的结果来看,样本化合物相似度较高的有机物极性参数的预测结果比样本化合物相似度低的有机物致敏性的预测结果好。虽然样本化合物的结构相似度和预测的结果并无严格的关系,但分类改善化合物的相似度同时也有效的改善了建模的预测结果。
[Abstract]:......
【学位授予单位】:山西师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O621.29
本文编号:2252080
[Abstract]:......
【学位授予单位】:山西师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O621.29
【参考文献】
相关期刊论文 前8条
1 任伟;孔德信;;定量构效关系研究中分子描述符的相关性[J];计算机与应用化学;2009年11期
2 张国文;潘军辉;王福民;阙青民;;主成分回归用于分光光度法同时测定6种食品添加剂[J];分析试验室;2007年07期
3 张丽平,俞欢军,陈德钊,胡上序;基于粒子群优化算法的神经网络在农药定量构效关系建模中的应用[J];分析化学;2004年12期
4 张国文,倪永年,朱志怀;化学计量学——光度法在食品多组份分析中的应用评述[J];食品科学;2003年11期
5 许旋,罗一帆,徐志广,赵军,刘展眉;4H-甲基咪唑苯二氮(艹卓)酮类抗HIV-1药物的量子化学研究[J];高等学校化学学报;2003年09期
6 陆光华,王超,包国章;芳香族化合物生物降解性的QSBR研究[J];化学通报;2003年06期
7 倪永年,邱萍;电化学分析在有机农药残留量分析中的应用[J];分析测试学报;2003年02期
8 屈凌波,相秉仁,安登魁;人工神经网络在中药模式识别中的应用[J];计算机与应用化学;2002年04期
相关博士学位论文 前1条
1 杜一平;化学数据挖掘新算法和定量构性关系基础研究[D];湖南大学;2002年
相关硕士学位论文 前1条
1 杨彩蓉;基于KNN与K均值聚类模式识别方法的同系与非同系有机物的定量结构毒性相关研究[D];山西师范大学;2016年
,本文编号:2252080
本文链接:https://www.wllwen.com/kejilunwen/huaxue/2252080.html
教材专著