基于广义极值分布的气象数据分类与聚类算法研究

发布时间:2023-01-28 10:52
  极值理论在机器学习中的应用日益广泛,常用于预测稀有事件的发生、刻画不对称的决策边界以及估计某些距离极值的分布等.本文借助极值理论,提出了两类改进的机器学习算法,并应用于气象领域的实际问题中.首先,对于监督学习,我们将广义极值分布与boosting算法相结合,提出了用于不平衡样本的二分类算法.在干旱、半干旱地区短临降水发生概率的估计问题中,该算法在一系列评价指标上表现突出,且拟合的模型具备良好的可解释性.其次,对于非监督学习,我们关注K-means聚类算法的改进.特别地,我们设计了基于极值分布的假设检验过程,用于识别数据中的离群点,并辅助判别聚类边界附近样本的归属.模拟实验表明,该检验步骤能有效地校正K-means模型中的误判点,从而提升模型表现.同时,在气象站点的聚类问题中,该算法给出了合理的聚类结果,且与常见的气候类型划分区域接近,为气象研究提供了有价值的参考. 

【文章页数】:48 页

【学位级别】:硕士

【文章目录】:
中文摘要
Abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 文献综述
        1.2.1 干旱、半干旱地区的短临降雨预报
        1.2.2 不平衡样本的二分类算法
        1.2.3 K-means聚类算法
    1.3 本文工作
第二章 理论基础
    2.1 极值定理
    2.2 广义线性模型
    2.3 梯度提升算法
    2.4 K-means算法
    2.5 二分类问题的评价准则
    2.6 聚类问题的评价准则
第三章 基于极值分布的不平衡样本二分类算法
    3.1 GEVboost算法描述
        3.1.1 F(·) 的估计方法
        3.1.2 参数 ξ 的估计方法
    3.2 模型的可解释性
    3.3 案例研究I: 澳大利亚的日降水预报
    3.4 案例研究II: 甘肃省的短临降水预报
        3.4.1 研究区域
        3.4.2 数据描述
        3.4.3 模型表现
        3.4.4 结果分析
第四章 基于极值分布的K-means改进算法
    4.1 K-means聚类中的离群点识别与判别边界的不确定性
    4.2 基于检验的K-means算法
    4.3 数值模拟与分析
    4.4 案例研究: 甘肃省站点的气候类型聚类
第五章 总结与展望
参考文献
致谢


【参考文献】:
期刊论文
[1]两种类型短时强降水形成机理对比分析——以甘肃两次短时强降水过程为例[J]. 许东蓓,苟尚,肖玮,孟丽霞,沙宏娥,狄潇泓,石延召.  高原气象. 2018(02)
[2]近55年来中国西北地区降水变化特征及影响因素分析[J]. 刘维成,张强,傅朝.  高原气象. 2017(06)
[3]C波段雷达资料在强降水过程中的应用[J]. 韩文宇,杨丽丽,杨毅.  干旱气象. 2016(01)
[4]河西走廊中部近53年降水变化及未来趋势预测[J]. 刘洪兰,白虎志,张俊国.  干旱区研究. 2011(01)
[5]中国气候区划新方案[J]. 郑景云,尹云鹤,李炳元.  地理学报. 2010(01)
[6]甘肃省近50a夏季极端强降水量的气候特征[J]. 张小明,杨金虎,高伟东,全志伟.  干旱气象. 2008(02)
[7]西北地区东部干旱半干旱区极端降水事件的变化[J]. 赵庆云,张武,王式功,刘新伟.  中国沙漠. 2005(06)
[8]近40年来甘肃省降水的变化特征[J]. 林纾,陆登荣.  高原气象. 2004(06)
[9]甘肃河东地区降雨特征分析研究[J]. 彭素琴,杨兴国,柯晓新,张旭东.  水科学进展. 1996(01)



本文编号:3732514

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3732514.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d9c57***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com