基于深度强化学习的GWLF模型优化研究
发布时间:2023-06-02 22:00
GWLF模型被认为是评价流域污染的一种有效的流域负荷模型。该模型通过输入气象数据,通过数学方式模拟整个过程,最终进行流域水文预测。不同的GWLF模型具有不同的类型参数,参数的数量、范围和精度不同,具有数量大、范围广、精度不确定性等特点。通过优化这些参数能够有效提高预测的效果和效率。然而,控制这些参数需要事先储备的相关专业知识和大量的、几乎详尽的测试。GWLF模型参数优化所提出的挑战促使了本文的研究。本文提出了一种基于深度强化学习(Deep Reinforcement Learning)的智能体参数优化模型,用于解决多参数输入,并找到参数值的最佳组合的问题。本文使用了在离散动作空间中表现优异的深度强化学习算法DQN作为基础算法,提出了状态空间、动作空间和奖励函数的建模方法,并提出了更加有效的参数初始化方法,以及在优化过程中自动修改调节步长的新策略。该模型基于神经网络的拟合能力和强化学习的决策能力,使用泾河流域的GWLF模型以及真实的气象数据进行的实验表明,该模型可以在较短的训练时间内找到NSE大于0.8的值,比其他优化相同GWLF模型的算法精度更高且耗时更少。最后,通过简单的实验验证了该...
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题来源
1.2 国内外研究现状
1.2.1 GWLF模型调优
1.2.2 黑盒优化问题研究
1.2.3 基于强化学习的优化研究
1.3 本文研究目的和主要内容
1.4 文章组织结构
第2章 相关技术和方法介绍
2.1 GWLF模型参数优化
2.2 深度强化学习
2.2.1 强化学习
2.2.2 Deep Q Network
2.2.3 DQN的改进算法
2.3 布谷鸟搜索算法
2.4 本章小结
第3章 基于DQN的GWLF调参模型设计
3.1 调参模型的框架设计
3.2 GWLF环境模型的设计
3.2.1 状态空间和动作空间
3.2.2 奖励函数
3.3 神经网络结构的设计
3.4 参数调节过程的设计
3.4.1 参数初始化方法
3.4.2 步长调节方法
3.5 本章小结
第4章 模型的实现与优化
4.1 GWLF模型参数优化算法的实现
4.1.1 基于Gym的环境模型结构介绍
4.1.2 调参算法实现
4.2 GWLF模型参数和数据集介绍
4.3 调参模型超参数整定
4.4 本章小结
第5章 实验与结果分析
5.1 GO-DQN算法与其他优化算法的对比
5.2 结合布谷鸟搜索算法
5.3 改进优化后的GO-DQN*算法
5.4 模型的泛化能力试验
5.4.1 预训练模型的使用
5.4.2 其他GWLF模型
5.4.3 其他参数优化问题
5.5 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
附录
发表论文和参加科研情况说明
致谢
本文编号:3828101
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题来源
1.2 国内外研究现状
1.2.1 GWLF模型调优
1.2.2 黑盒优化问题研究
1.2.3 基于强化学习的优化研究
1.3 本文研究目的和主要内容
1.4 文章组织结构
第2章 相关技术和方法介绍
2.1 GWLF模型参数优化
2.2 深度强化学习
2.2.1 强化学习
2.2.2 Deep Q Network
2.2.3 DQN的改进算法
2.3 布谷鸟搜索算法
2.4 本章小结
第3章 基于DQN的GWLF调参模型设计
3.1 调参模型的框架设计
3.2 GWLF环境模型的设计
3.2.1 状态空间和动作空间
3.2.2 奖励函数
3.3 神经网络结构的设计
3.4 参数调节过程的设计
3.4.1 参数初始化方法
3.4.2 步长调节方法
3.5 本章小结
第4章 模型的实现与优化
4.1 GWLF模型参数优化算法的实现
4.1.1 基于Gym的环境模型结构介绍
4.1.2 调参算法实现
4.2 GWLF模型参数和数据集介绍
4.3 调参模型超参数整定
4.4 本章小结
第5章 实验与结果分析
5.1 GO-DQN算法与其他优化算法的对比
5.2 结合布谷鸟搜索算法
5.3 改进优化后的GO-DQN*算法
5.4 模型的泛化能力试验
5.4.1 预训练模型的使用
5.4.2 其他GWLF模型
5.4.3 其他参数优化问题
5.5 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
附录
发表论文和参加科研情况说明
致谢
本文编号:3828101
本文链接:https://www.wllwen.com/wenshubaike/qiuzhijiqiao/3828101.html
最近更新
教材专著