基于Adaboost算法的多分类器模型的研究及其在降水预测中的应用
发布时间:2020-09-02 17:35
随着社会经济的不断发展与进步,各行各业的发展与需求对气象预测要求在不断提高。与传统的气象预测模式相比,获取气象数据的渠道日益丰富,气象数据资料呈现爆炸式增长,如何有效利用这些海量气象数据对于推进气象领域进步有决定性作用,气象数据具有的高维性和大规模特点,意味着传统的气象模式很难将各维度的气象数据以及各气象数据之间有效联系起来,而现今的数据挖掘技术较为成熟,为研究与探索气象领域中各个属性内在规律与联系、寻找天气变化有指导性意义。本论文针对气象中降水预测问题进行研究与分析,在掌握和分析现有最新气象数据挖掘技术的基础上,对现有的天气预测模型提出相应改进。摒弃单分类的气象预测模型,利用Adaboost算法集成强分类器达到提升性能的目的,通过详细研究气象样本数据特点,对气象数据挖掘建模,数据属性处理,并对集成预测模型进行深入研究,主要完成以下工作。(1)针对Adaboost算法集成分类器在气象降水预测中存在着学习性能退化而导致的精度不足问题,本文通过理论推导证明集成分类器的误差上界与学习过程中归一化因子的关系以及优化的本质思想,对Adaboost算法在样本的学习过程中权值的更新方式进行调整,提出基于归一化因子与依赖度的权值修正算法,改进后的算法目标是依据信赖度调整样本的权值的更新幅度,以此来缓解误差累积问题,从而达到提高性能的目的,实验表明,该种改进方式提高了预测的性能。(2)针对气象领域中的降水数据集总是存在着数据集分布不平衡问题,本文提出基于损失代价敏感的不平衡学习方式,通过改进Adaboost算法中每个样本根据不同的分类预测结果而产生不同的损失代价为核心思想,以最小化损失代价为目标函数,引入惩罚因子,通过理论证明与推导,调整基分类器学习过程中的权值更新方式,同时给出基分类器的误差阈值。通过实验表明,该种改进确实提高了对数据集中的少数类的学习能力,有效的提高了集成分类器的性能。通过降水实验以及评价方案的数据结果可知,本文提出的改进算法与传统数据挖掘算法相比,有较好的性能体现。该种预测模型增强了气象预测效率,且对气象数据总是具有良好的表现,为以后的气象数据挖掘提供了更好的解决方案借鉴。
【学位单位】:南京信息工程大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP181;P426.6
【部分图文】:
逡逑进行评估,通过评估的结果进行应用[4<M1]。挖掘过程如下图2-1所示。逡逑问i定名逦灥仓库逦屖逦知识逦应用逡逑:逦邋准备邋''^清洗与集逦f邋.逦厂、逦/S逡逑逦r- ̄ ̄?逦逦^逦r逦'/二逡逑1逦^逦1邋■邋一—0邋rj邋i\逡逑分类/回归逦数据库逦数据挖抑一—评估逦」-逦、广,逡逑_逦数据挖掘流程逦——逡逑图2-1数据挖掘过程示意图逡逑问题定义是根据挖掘的对象来分析需要解决的问题,数据挖掘研宄者对现有的问题逡逑分析来决定展开接下来的一系列操作,分析该问题可能是分类预测、聚类分析、回归分逡逑析等,之后根据研宄目标展开接下来的数据处理工作等。逡逑数据准备是确定数据挖掘任务执行阶段所涉及的数据集,该阶段主要是通过现有的逡逑相关数据资料中选取适合数据挖掘算法研宄的数据源,将选出来的数据作为此次任务中逡逑的试验目标。逡逑数据处理中包含多个对数据的处理的过程,每个过程有不同的处理方式,该过程主逡逑要是数据清洗、数据转换、特征选择
BP神经网络有很多种拓扑结构,为了表述方便,本文使用最为普遍的三层的网络逡逑结构作为推算案例,推算其运算公式。存在三层BP神经网络,用f表示输入神经元,_/逡逑代表隐含层,々代表输出层,其结构如图2-2所示,如图所示,在隐含层%中,第个逡逑神经元的输入是:逡逑netj邋=邋^邋wjjxi逦(2-1)逡逑输出层的第y_个神经兀的输出为oy.邋=g(nef;),第个输出神经兀的输入为:逡逑netk=Y.w^j°j逦2-2)逡逑J逡逑相应的输出为=呈(《4),其中§阳为S型激活函数,其表达规则如下:逡逑g(x)邋=邋l邋+邋e-(^)逦(2-3)逡逑其中,0为网络阈值,网络中各个神经元的输出为:逡逑0j邋=1/(1邋+邋exp(-(J]邋wyio,.邋+邋dj)))逦(2-4)逡逑0k=H{\邋+邋exp(-(^]邋wkJ0j邋+邋dk)))逦(2-5)逡逑j逡逑BP神经网络学习过程其实是在输出值与实际值产生了误差后逆向地将误差向前传逡逑11逡逑
将由于存在P+g邋=邋l的关系,而对归一化因子的问题的分析可以看作变量;的逡逑函数关系寻找极值问题的理解,该种关系可以被视作为归一化因子与两数之差的函数关逡逑系,如下图3-1所TfC:逡逑16逡逑
本文编号:2810902
【学位单位】:南京信息工程大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP181;P426.6
【部分图文】:
逡逑进行评估,通过评估的结果进行应用[4<M1]。挖掘过程如下图2-1所示。逡逑问i定名逦灥仓库逦屖逦知识逦应用逡逑:逦邋准备邋''^清洗与集逦f邋.逦厂、逦/S逡逑逦r- ̄ ̄?逦逦^逦r逦'/二逡逑1逦^逦1邋■邋一—0邋rj邋i\逡逑分类/回归逦数据库逦数据挖抑一—评估逦」-逦、广,逡逑_逦数据挖掘流程逦——逡逑图2-1数据挖掘过程示意图逡逑问题定义是根据挖掘的对象来分析需要解决的问题,数据挖掘研宄者对现有的问题逡逑分析来决定展开接下来的一系列操作,分析该问题可能是分类预测、聚类分析、回归分逡逑析等,之后根据研宄目标展开接下来的数据处理工作等。逡逑数据准备是确定数据挖掘任务执行阶段所涉及的数据集,该阶段主要是通过现有的逡逑相关数据资料中选取适合数据挖掘算法研宄的数据源,将选出来的数据作为此次任务中逡逑的试验目标。逡逑数据处理中包含多个对数据的处理的过程,每个过程有不同的处理方式,该过程主逡逑要是数据清洗、数据转换、特征选择
BP神经网络有很多种拓扑结构,为了表述方便,本文使用最为普遍的三层的网络逡逑结构作为推算案例,推算其运算公式。存在三层BP神经网络,用f表示输入神经元,_/逡逑代表隐含层,々代表输出层,其结构如图2-2所示,如图所示,在隐含层%中,第个逡逑神经元的输入是:逡逑netj邋=邋^邋wjjxi逦(2-1)逡逑输出层的第y_个神经兀的输出为oy.邋=g(nef;),第个输出神经兀的输入为:逡逑netk=Y.w^j°j逦2-2)逡逑J逡逑相应的输出为=呈(《4),其中§阳为S型激活函数,其表达规则如下:逡逑g(x)邋=邋l邋+邋e-(^)逦(2-3)逡逑其中,0为网络阈值,网络中各个神经元的输出为:逡逑0j邋=1/(1邋+邋exp(-(J]邋wyio,.邋+邋dj)))逦(2-4)逡逑0k=H{\邋+邋exp(-(^]邋wkJ0j邋+邋dk)))逦(2-5)逡逑j逡逑BP神经网络学习过程其实是在输出值与实际值产生了误差后逆向地将误差向前传逡逑11逡逑
将由于存在P+g邋=邋l的关系,而对归一化因子的问题的分析可以看作变量;的逡逑函数关系寻找极值问题的理解,该种关系可以被视作为归一化因子与两数之差的函数关逡逑系,如下图3-1所TfC:逡逑16逡逑
【参考文献】
相关期刊论文 前10条
1 彭昱忠;王谦;元昌安;林开平;;数据挖掘技术在气象预报研究中的应用[J];干旱气象;2015年01期
2 王永欣;张化祥;王爽;;基于属性加权的主成分分析算法[J];济南大学学报(自然科学版);2015年06期
3 吴俊利;张步涵;王魁;;基于Adaboost的BP神经网络改进算法在短期风速预测中的应用[J];电网技术;2012年09期
4 高爽;冬雷;高阳;廖晓钟;;基于粗糙集理论的中长期风速预测[J];中国电机工程学报;2012年01期
5 付忠良;;不平衡多分类问题的连续AdaBoost算法研究[J];计算机研究与发展;2011年12期
6 马廷淮;穆强;田伟;李德泉;;气象数据挖掘研究[J];武汉理工大学学报;2010年16期
7 薛建军;王维国;王秀荣;张建忠;李佳英;;决策气象服务回顾与展望[J];气象;2010年07期
8 吴建生;刘丽萍;金龙;;粒子群-神经网络集成学习算法气象预报建模研究[J];热带气象学报;2008年06期
9 何伟;孔梦荣;赵海青;;基于贝叶斯分类器的气象预测研究[J];计算机工程与设计;2007年15期
10 贺玲;吴玲达;蔡益朝;;数据挖掘中的聚类算法综述[J];计算机应用研究;2007年01期
相关会议论文 前1条
1 王在文;;基于非线性支持向量机方法的奥运场馆气象预报[A];第27届中国气象学会年会城市气象,让生活更美好分会场论文集[C];2010年
本文编号:2810902
本文链接:https://www.wllwen.com/projectlw/qxxlw/2810902.html