基于决策树方法的热带云团发展分类及关键因子挖掘研究
发布时间:2023-04-25 21:29
热带云团(Tropical Cloud Cluster, TCC)如何发展成热带气旋(Tropical Cyclone, TC)及其气候特征的研究对TC生成预报至关重要,但与其生成后的研究相比,TCC发展规律的研究较少。数据挖掘是一种新的数据分析技术,过去预测TC生成的统计方法普遍缺乏捕获规律的能力,而数据挖掘能够揭示数据中隐藏的规律,利用其对数据的分析能力建立分类预测模型并结合TC生成的动力学理论从中提取有用的信息,为TC生成研究提供新思路。本文利用决策树算法对TCC是否发展成TC进行分类预测,并从算法中提取影响TCC发展的关键因子,得到以下结论:(1)将TCC能否发展成为TC抽象为二元分类问题,使用CART和C4.5算法根据TC生成前24小时TCC数据对西北太平洋TC生成情况进行预测,并与判别分析的预测结果进行对比。结果表明C4.5算法比CART算法、判别分析的预测准确率高,其训练集准确率为85.69%,测试集为85.03%,能够较好地区分发展类与不发展类TCC的环境场特征。(2)决策树算法发现925hPa散度和700hPa相对涡度是区分发展与不发展TCC非常重要的环境场因子。进一...
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究进展
1.2.1 热带云团发展与热带气旋生成研究进展
1.2.2 数据挖掘分类算法研究现状
1.2.3 数据挖掘算法在热带气旋研究上的应用
1.3 研究思路与内容
第二章 资料与方法
2.1 资料来源及处理流程
2.2 决策树分类算法原理
2.2.1 决策树的剪枝
2.2.2 分类终止条件
2.2.3 C4.5算法原理
2.2.4 CART算法原理
2.3 统计方法
2.3.1 相关分析
2.3.2 t检验
2.3.3 BDI指数
2.3.4 热带云团生成率
第三章 热带云团发展状况分类预测
3.1 因子的选取
3.2 数据预处理
3.3 决策树算法与判别分析对比
3.4 决策树分类规则解释与分析
3.5 本章小结
第四章 影响热带云团发展的关键因子挖掘及分析
4.1 关键因子重要性排序
4.2 主要大气环境场因子与热带云团发展的联系
4.3 西北太平洋不同区域热带云团发展差异
4.4 海温与热带云团发展的联系
4.4.1 两类El Nino事件对热带云团发展的影响
4.4.2 热带云团发展与两类El Nino相联系的大尺度环流因素
4.4.3 热带云团在风切变偏大区发展的可能原因
4.5 本章小结
第五章 总结与展望
5.1 总结
5.2 下一步工作及展望
参考文献
致谢
作者简介
本文编号:3801096
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究进展
1.2.1 热带云团发展与热带气旋生成研究进展
1.2.2 数据挖掘分类算法研究现状
1.2.3 数据挖掘算法在热带气旋研究上的应用
1.3 研究思路与内容
第二章 资料与方法
2.1 资料来源及处理流程
2.2 决策树分类算法原理
2.2.1 决策树的剪枝
2.2.2 分类终止条件
2.2.3 C4.5算法原理
2.2.4 CART算法原理
2.3 统计方法
2.3.1 相关分析
2.3.2 t检验
2.3.3 BDI指数
2.3.4 热带云团生成率
第三章 热带云团发展状况分类预测
3.1 因子的选取
3.2 数据预处理
3.3 决策树算法与判别分析对比
3.4 决策树分类规则解释与分析
3.5 本章小结
第四章 影响热带云团发展的关键因子挖掘及分析
4.1 关键因子重要性排序
4.2 主要大气环境场因子与热带云团发展的联系
4.3 西北太平洋不同区域热带云团发展差异
4.4 海温与热带云团发展的联系
4.4.1 两类El Nino事件对热带云团发展的影响
4.4.2 热带云团发展与两类El Nino相联系的大尺度环流因素
4.4.3 热带云团在风切变偏大区发展的可能原因
4.5 本章小结
第五章 总结与展望
5.1 总结
5.2 下一步工作及展望
参考文献
致谢
作者简介
本文编号:3801096
本文链接:https://www.wllwen.com/projectlw/qxxlw/3801096.html