基于广义极值分布的气象数据分类与聚类算法研究
发布时间:2023-01-28 10:52
极值理论在机器学习中的应用日益广泛,常用于预测稀有事件的发生、刻画不对称的决策边界以及估计某些距离极值的分布等.本文借助极值理论,提出了两类改进的机器学习算法,并应用于气象领域的实际问题中.首先,对于监督学习,我们将广义极值分布与boosting算法相结合,提出了用于不平衡样本的二分类算法.在干旱、半干旱地区短临降水发生概率的估计问题中,该算法在一系列评价指标上表现突出,且拟合的模型具备良好的可解释性.其次,对于非监督学习,我们关注K-means聚类算法的改进.特别地,我们设计了基于极值分布的假设检验过程,用于识别数据中的离群点,并辅助判别聚类边界附近样本的归属.模拟实验表明,该检验步骤能有效地校正K-means模型中的误判点,从而提升模型表现.同时,在气象站点的聚类问题中,该算法给出了合理的聚类结果,且与常见的气候类型划分区域接近,为气象研究提供了有价值的参考.
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 文献综述
1.2.1 干旱、半干旱地区的短临降雨预报
1.2.2 不平衡样本的二分类算法
1.2.3 K-means聚类算法
1.3 本文工作
第二章 理论基础
2.1 极值定理
2.2 广义线性模型
2.3 梯度提升算法
2.4 K-means算法
2.5 二分类问题的评价准则
2.6 聚类问题的评价准则
第三章 基于极值分布的不平衡样本二分类算法
3.1 GEVboost算法描述
3.1.1 F(·) 的估计方法
3.1.2 参数 ξ 的估计方法
3.2 模型的可解释性
3.3 案例研究I: 澳大利亚的日降水预报
3.4 案例研究II: 甘肃省的短临降水预报
3.4.1 研究区域
3.4.2 数据描述
3.4.3 模型表现
3.4.4 结果分析
第四章 基于极值分布的K-means改进算法
4.1 K-means聚类中的离群点识别与判别边界的不确定性
4.2 基于检验的K-means算法
4.3 数值模拟与分析
4.4 案例研究: 甘肃省站点的气候类型聚类
第五章 总结与展望
参考文献
致谢
【参考文献】:
期刊论文
[1]两种类型短时强降水形成机理对比分析——以甘肃两次短时强降水过程为例[J]. 许东蓓,苟尚,肖玮,孟丽霞,沙宏娥,狄潇泓,石延召. 高原气象. 2018(02)
[2]近55年来中国西北地区降水变化特征及影响因素分析[J]. 刘维成,张强,傅朝. 高原气象. 2017(06)
[3]C波段雷达资料在强降水过程中的应用[J]. 韩文宇,杨丽丽,杨毅. 干旱气象. 2016(01)
[4]河西走廊中部近53年降水变化及未来趋势预测[J]. 刘洪兰,白虎志,张俊国. 干旱区研究. 2011(01)
[5]中国气候区划新方案[J]. 郑景云,尹云鹤,李炳元. 地理学报. 2010(01)
[6]甘肃省近50a夏季极端强降水量的气候特征[J]. 张小明,杨金虎,高伟东,全志伟. 干旱气象. 2008(02)
[7]西北地区东部干旱半干旱区极端降水事件的变化[J]. 赵庆云,张武,王式功,刘新伟. 中国沙漠. 2005(06)
[8]近40年来甘肃省降水的变化特征[J]. 林纾,陆登荣. 高原气象. 2004(06)
[9]甘肃河东地区降雨特征分析研究[J]. 彭素琴,杨兴国,柯晓新,张旭东. 水科学进展. 1996(01)
本文编号:3732514
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 文献综述
1.2.1 干旱、半干旱地区的短临降雨预报
1.2.2 不平衡样本的二分类算法
1.2.3 K-means聚类算法
1.3 本文工作
第二章 理论基础
2.1 极值定理
2.2 广义线性模型
2.3 梯度提升算法
2.4 K-means算法
2.5 二分类问题的评价准则
2.6 聚类问题的评价准则
第三章 基于极值分布的不平衡样本二分类算法
3.1 GEVboost算法描述
3.1.1 F(·) 的估计方法
3.1.2 参数 ξ 的估计方法
3.2 模型的可解释性
3.3 案例研究I: 澳大利亚的日降水预报
3.4 案例研究II: 甘肃省的短临降水预报
3.4.1 研究区域
3.4.2 数据描述
3.4.3 模型表现
3.4.4 结果分析
第四章 基于极值分布的K-means改进算法
4.1 K-means聚类中的离群点识别与判别边界的不确定性
4.2 基于检验的K-means算法
4.3 数值模拟与分析
4.4 案例研究: 甘肃省站点的气候类型聚类
第五章 总结与展望
参考文献
致谢
【参考文献】:
期刊论文
[1]两种类型短时强降水形成机理对比分析——以甘肃两次短时强降水过程为例[J]. 许东蓓,苟尚,肖玮,孟丽霞,沙宏娥,狄潇泓,石延召. 高原气象. 2018(02)
[2]近55年来中国西北地区降水变化特征及影响因素分析[J]. 刘维成,张强,傅朝. 高原气象. 2017(06)
[3]C波段雷达资料在强降水过程中的应用[J]. 韩文宇,杨丽丽,杨毅. 干旱气象. 2016(01)
[4]河西走廊中部近53年降水变化及未来趋势预测[J]. 刘洪兰,白虎志,张俊国. 干旱区研究. 2011(01)
[5]中国气候区划新方案[J]. 郑景云,尹云鹤,李炳元. 地理学报. 2010(01)
[6]甘肃省近50a夏季极端强降水量的气候特征[J]. 张小明,杨金虎,高伟东,全志伟. 干旱气象. 2008(02)
[7]西北地区东部干旱半干旱区极端降水事件的变化[J]. 赵庆云,张武,王式功,刘新伟. 中国沙漠. 2005(06)
[8]近40年来甘肃省降水的变化特征[J]. 林纾,陆登荣. 高原气象. 2004(06)
[9]甘肃河东地区降雨特征分析研究[J]. 彭素琴,杨兴国,柯晓新,张旭东. 水科学进展. 1996(01)
本文编号:3732514
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3732514.html