有机物的结构与粘度等安全参数的定量构效关系模型研究
发布时间:2017-09-13 13:10
本文关键词:有机物的结构与粘度等安全参数的定量构效关系模型研究
更多相关文章: 定量构效关系 预测模型 粘度 热容 热导率 自燃点
【摘要】:热安全在化工生产安全中占有极其重要的地位。本论文选择粘度、热容、热导率和自燃点这四个安全参数进行预测研究,对生产安全有着重要的理论意义和实用价值。基于QSPR (Quantitative Structure-Property Relationship)基本原理,构建了有机物粘度、热容、热导率、自燃点与其分子结构间的QSPR预测模型,探究影响其性质的结构因素。主要研究方法与结论如下:(1)采用Dragon 2.1软件计算化合物的分子描述符,以迭代自组织数据分析技术(Iterative Self-Organizing Data Analysis Techniques Algorithm, ISODATA)将样本集初步分类,随后在各个类别中随机选取样本作为训练集用于建立模型。分别运用遗传算法(Genetic Algorithm, GA)和蚁群算法(Ant Colony Optimization, ACO)获取特征描述符,并分析了特征描述符与其性质间的关系。将特征描述符作为模型的输入参数,分别与多元线性回归(Multiple Linear Regression, MLR)法和支持向量机(Support Vector Machine, SVM)法结合建立了GA-MLR、GA-SVM、ACO-MLR和ACO-SVM模型。采用模型评价参数对所建模型性能进行了全面的评价验证,应用Williams图对模型的应用域进行了研究,找出了标准残差和臂比值超出界定范围的化合物,并分析了出现“异常值”的原因。将所建预测模型与文献中已有模型进行比较,发现所建模型优于文献中已有模型。(2)对有机物粘度与其分子结构间的QSPR研究结果如下:ISODATA算法将310种化合物分成11类,选取248种化合物作为训练集建立粘度预测模型。GA和ACO筛选出的特征描述符均认为化合物的粘度值大小主要由化合物的溶解熵大小以及分子中亲水基团的数目所决定,且GA筛选出的nOH描述符明确指出是亲水基团中的羟基数目。所建立的四个粘度预测模型决定系数R2均在0.75以上,预测效果令人满意。其中,GA-MLR模型优于ACO-MLR模型,GA-SVM模型优于ACO-SVM模型,GA-MLR模型和GA-SVM模型的R2达到0.9左右,表明GA筛选出了对粘度有较大影响的特征结构。(3)采用相似的方法对有机物的热容进行了QSPR研究,结果如下:ISODATA算法将650种化合物分成16类,520种化合物作为训练集。由GA和ACO均获得5个特征描述符,且获得了一个对热容贡献度最大的相同特征描述符即SIK,该描述符主要反映杂化原子以及杂化状态对分子形状的影响程度。所建热容预测模型非常优秀,其R2均在0.90以上。通过模型的比较发现,GA-MLR模型优于ACO-MLR模型,GA-SVM模型优于ACO-SVM模型,GA-MLR模型和GA-SVM模型的R2达到0.95以上,预测结果非常满意。(4)同样地,对有机物热导率进行了QSPR研究。结果为:ISODATA算法将178种化合物分成10类,142种化合物作为训练集。GA筛选出的特征描述符主要反映分子中氟原子的数目、分子的极化率、原子对以及整个分子中的电荷转换、原子范德华体积大小等,以特征描述符作为输入参数,建立了GA-MLR和GA-SVM模型,其预测结果比较令人满意,R2均在0.70以上,且后者优于前者,说明SVM是一种可以快速、有效、准确预测有机物热导率的工具。(5)对有机物自燃点进行QSPR研究结果如下:ISODATA算法将265种化合物分成5类,212种化合物作为训练集。由GA获得的特征描述符主要反映分子大小、分子中支链数目、整个分子中原子的立体空间结构等,以其作为模型输入参数获得GA-MLR和GA-SVM模型,其R2均在0.75以上,结果比较理想。由ACO获得的特征描述符所建的ACO-SVM模型预测效果令人满意,训练集和测试集的R2均在0.80以上,表明ACO获得的特征描述符与自燃点之间存在较强的非线性关系。此外,GA-SVM和ACO-SVM模型均优于GA-MLR模型,表明分子结构与自燃点之间存在较强的非线性关系。
【关键词】:定量构效关系 预测模型 粘度 热容 热导率 自燃点
【学位授予单位】:南京理工大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:O621.13
【目录】:
- 摘要5-7
- Abstract7-17
- 1 绪论17-25
- 1.1 研究背景17-18
- 1.2 国内外研究进展18-23
- 1.2.1 粘度预测方法的研究进展18-20
- 1.2.2 热容预测方法的研究进展20-21
- 1.2.3 热导率预测方法的研究进展21-22
- 1.2.4 自燃点预测方法的研究进展22-23
- 1.3 本文的主要研究内容23-25
- 2 QSPR研究的基本理论25-37
- 2.1 分子描述符25-28
- 2.1.1 分子描述符种类26-27
- 2.1.2 分子描述符的计算27-28
- 2.2 训练集和测试集的划分28-30
- 2.3 分子描述符的筛选与建模30-31
- 2.3.1 分子描述符筛选方法30
- 2.3.2 QSPR中的建模方法30-31
- 2.4 模型的评价验证31-36
- 2.5 模型应用域的评价与验证36
- 2.6 小结36-37
- 3 QSPR主要研究方法37-49
- 3.1 ISODATA算法简介37-39
- 3.1.1 ISODATA算法的基本原理38-39
- 3.1.2 ISODATA算法的实现39
- 3.2 蚁群算法的基本原理39-41
- 3.2.1 蚁群算法的简介39-41
- 3.2.2 目标函数的选择41
- 3.2.3 蚁群算法的实现41
- 3.3 遗传算法的基本原理41-44
- 3.3.1 遗传算法简介41-43
- 3.3.2 函数的选择43-44
- 3.3.3 遗传算法的实现44
- 3.4 支持向量机的基本原理44-48
- 3.4.1 理论背景44-45
- 3.4.2 支持向量机回归算法45-47
- 3.4.3 参数优化47-48
- 3.4.4 算法的实现48
- 3.5 小结48-49
- 4 有机物粘度的QSPR预测研究49-73
- 4.1 引言49-50
- 4.2 实验过程50-57
- 4.2.1 样本说明50
- 4.2.2 分子描述符的计算与预筛选50-52
- 4.2.3 样本集的划分52-56
- 4.2.4 分子描述符的筛选与建模56-57
- 4.3 结果与讨论57-72
- 4.3.1 GA-MLR粘度预测模型57-58
- 4.3.2 GA-SVM粘度预测模型58-60
- 4.3.3 ACO-MLR粘度预测模型60-62
- 4.3.4 ACO-SVM粘度预测模型62-64
- 4.3.5 模型性能及应用域评价64-71
- 4.3.6 模型的比较71-72
- 4.4 小结72-73
- 5 有机物热容的QSPR预测研究73-94
- 5.1 引言73
- 5.2 实验过程73-78
- 5.2.1 样本说明73
- 5.2.2 分子描述符的计算与预筛选73-74
- 5.2.3 样本集的划分74-78
- 5.2.4 分子描述符的筛选与建模78
- 5.3 结果与讨论78-93
- 5.3.1 GA-MLR热容预测模型78-80
- 5.3.2 GA-SVM热容预测模型80-82
- 5.3.3 ACO-MLR热容预测模型82-84
- 5.3.4 ACO-SVM热容预测模型84-85
- 5.3.5 模型性能及应用域评价85-92
- 5.3.6 模型的比较92-93
- 5.4 小结93-94
- 6 有机物热导率的QSPR预测研究94-108
- 6.1 引言94
- 6.2 实验过程94-97
- 6.2.1 样本说明94-95
- 6.2.2 分子描述符的计算与预筛选95
- 6.2.3 样本集的划分95-97
- 6.2.4 分子描述符的筛选与建模97
- 6.3 结果与讨论97-106
- 6.3.1 GA-MLR热导率预测模型97-99
- 6.3.2 GA-SVM热导率预测模型99-101
- 6.3.3 ACO-MLR热导率预测模型101-102
- 6.3.4 ACO-SVM热导率预测模型102
- 6.3.5 模型性能及应用域评价102-106
- 6.3.6 模型的比较106
- 6.4 小结106-108
- 7 有机物自燃点的QSPR预测研究108-124
- 7.1 引言108
- 7.2 实验过程108-111
- 7.2.1 样本说明108-109
- 7.2.2 分子描述符的计算与预筛选109
- 7.2.3 样本集的划分109-111
- 7.2.4 分子描述符的筛选与建模111
- 7.3 结果与讨论111-122
- 7.3.1 GA-MLR自燃点预测模型111-113
- 7.3.2 GA-SVM自燃点预测模型113-115
- 7.3.3 ACO-MLR自燃点预测模型115-116
- 7.3.4 ACO-SVM自燃点预测模型116-117
- 7.3.5 模型性能及应用域评价117-122
- 7.3.6 模型的比较122
- 7.4 小结122-124
- 8 结论124-127
- 8.1 结论124-125
- 8.2 创新点125
- 8.3 展望125-127
- 致谢127-128
- 参考文献128-142
- 附录A142-143
- 附录B143-144
- 附录C144-172
- 附录C.1 各化合物名称及其对应的粘度数据144-151
- 附录C.2 各化合物名称及其对应的热容数据151-164
- 附录C.3 各化合物名称及其对应的热导率数据164-168
- 附录C.4 各化合物名称及其对应的自燃点数据168-172
【参考文献】
中国期刊全文数据库 前2条
1 李元萍,李元良;MATLAB编程实现ISODATA算法[J];矿业研究与开发;2005年03期
2 ;Synthesis and thermal conductivity of microfluidic copper nanofluids[J];Particuology;2010年03期
,本文编号:843887
本文链接:https://www.wllwen.com/shoufeilunwen/gckjbs/843887.html