当前位置:主页 > 科技论文 > 自动化论文 >

基于集成机器学习方法对有机化合物生态毒性预测和风险评估

发布时间:2023-06-28 05:55
  随着城市化进程的加快,有机化合物的生产和使用日益增加,给人类带来许多便利和好处。但是,有机化学品的存在伴随着环境污染,影响着自然资源的方方面面,其毒副作用为生态环境带来了极大的负面影响,包括大气,土壤,水和依存的生物等。传统微生物降解有机污染物的方法繁琐、占地面积大、成本高,且无法从源头上阻止污染物进入环境,日益不适应现代社会的快速发展,采用机器学习方法预测和评估有机化合物的生态毒性,可以高效快捷地判断这些化学品可能对于人类和生态环境的潜在风险,并有助于深入开展有机化合物的生物降解研究。本研究采用分子指纹结合三种机器学习方法(包括随机森林、支持向量机和极端梯度提升),分别开发了有机化合物对大气环境、陆地环境和水体环境生态毒性的集成分类预测模型,经过五折交叉验证后,得到集成模型对来自三类模式生物的数据集的整体预测准确度分别达到88.7%、76.1%和92.6%,在接收器工作特征曲线(ROC)下的面积(AUC)为0.870、0.838和0.966。与先前报道的方法相比,集成模型实现了较高的准确率和AUC值。最后,使用随机森林算法进行特征重要性分析,确定了一些能代表性的表征生态毒性的结构特征...

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 选题背景及研究意义
    1.2 研究思路与内容
第2章 国内外文献综述
    2.1 有机污染物的微生物降解
    2.2 QSAR技术概论
    2.3 机器学习方法概论
    2.4 环境中有机污染物的毒性预测
        2.4.1 有机污染物对大气环境的毒性预测
        2.4.2 有机污染物对陆地环境的毒性预测
        2.4.3 有机污染物对水体环境的毒性预测
        2.4.4 有机污染物对环境中微生物的毒性预测
第3章 用集成学习方法构建有机化合物生态毒性预测模型
    3.1 引言
    3.2 实验数据收集
        3.2.1 大气环境数据
        3.2.2 陆地环境数据
        3.2.3 水体环境数据
    3.3 模型构建与评估方法
        3.3.1 分子指纹的计算
        3.3.2 特征选择
        3.3.3 模型构建
            3.3.3.1 支持向量机
            3.3.3.2 随机森林
            3.3.3.3 极端梯度提升
            3.3.3.4 集成学习方法
        3.3.4 模型性能评估
        3.3.5 警示子结构分析
    3.4 结果与讨论
        3.4.1 数据集分析
        3.4.2 基分类模型性能
            3.4.2.1 大气环境模型
            3.4.2.2 陆生环境模型
            3.4.2.3 水生环境模型
        3.4.3 集成模型的性能
        3.4.4 与文献中报道的方法的比较
        3.4.5 与生态毒性相关的结构特征
    3.5 本章小结
第4章 结论与展望
    4.1 结论
    4.2 存在问题与展望
致谢
参考文献
附录 FP4分子指纹对应的结构特征
攻读学位期间发表的学术论文及参加科研情况



本文编号:3836112

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3836112.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4935a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com