当前位置:主页 > 理工论文 > 气象学论文 >

朴素贝叶斯分类算法在降雨预测中的研究与应用

发布时间:2020-05-20 21:14
【摘要】:随着社会的不断进步和发展,各行各业都与气象预报有着密切的关系,特别是对一些灾害性天气的准确预报尤为重要。与此同时科技的快速发展以及气象观测技术的不断进步,积累了海量的气象数据,其中蕴藏着大量气象规律,如何从气象数据中获得有价值的信息成为一项重要的研究内容。本文主要研究朴素贝叶斯分类算法(Naive Bayesian Classif1cation,NBC)对降雨等级分类预测的问题,指出了离散化对朴素贝叶斯分类算法的有效性和属性赋权对朴素贝叶斯分类算法的重要性,从预测因子的属性值离散化和朴素贝叶斯分类算法假设属性之间相互条件独立两个方面,来改进朴素贝叶斯分类算法。通过分析样本气象数据,选择出降雨预测因子,然后建立改进的朴素贝叶斯分类模型,完成对降雨等级的分类预测。本论文主要研究以下内容:针对气象数据集中降雨类分布的不平衡性和连续数值型属性的离散化问题,提出了改进的类-属性关联离散化算法(Class-Attribute Interdependency Discretization,CAID)。通过分析类与属性的二维量化矩阵后,充分考虑了气象数据在属性中的分布情况,同时结合了不同的离散标准,提出了改进的离散化准则CAID,然后基于该准则设计实现了CAID算法。该算法从候选断点集中选择出最佳的断点,把属性域分割成若干区间,在信息损失最少的情况下得到更加合理的离散化方案,并提高了少数降雨类的识别率,更加有利于后续模型的学习。然后在CAID算法离散后的真实气象数据上构建一种基于CAID算法的朴素贝叶斯分类模型(D-NBC),实现对降雨等级的分类预测。通过分析对比实验结果,验证了本文提出的算法可以更好的解决气象数据中连续数值型属性的离散化问题,相比较其它算法在后续的分类预测中有更好的性能提升。针对朴素贝叶斯分类算法假设属性之间相互条件独立的问题,为了提高朴素贝叶斯分类算法的分类精度,提出一种基于属性加权的改进朴素贝叶斯分类算法(INBC),该算法使用互信息与条件互信息综合确定每个属性的权值,以此来削弱属性之间相互条件独立的假设,然后在CAID算法离散后的真实气象数据下,构建基于属性加权的朴素贝叶斯降雨等级预测模型。对比分析实验结果表明,本文提出的加权朴素贝叶斯分类模型具有更好的分类性能,在一定程度上提高了朴素贝叶斯模型对降雨等级分类预测的精度。
【图文】:

对比图,准确率,等级,对比图


图3-3各降雨等级召回率对比图逡逑图3-2、3-3统计了邋4种模型处理同一数据集对每个降雨等级分类预测的准确率回率,可以看出四种模型对C0级的分类预测准确率和召回率最高,主要是所选天气无雨样本数比较大,但是仍然可以看出D-NBC模型的预测性能最好,其准召回率分别达到88%和84%左右。从图3-2、3-3的总体趋势来看,相比较C-NBC逡逑D-NBC模型,经典NBC模型的预测性能最差,说明对预测因子属性值进行离散作,可以在一定程度上提高NBC模型的分类预测精度。随着降雨等级分布的越来30逡逑

气象图,样本容量,预测性能,分类模型


训练行/10*10*10逡逑图3-4样本容量与预测性能对比图逡逑图3-4统计了邋NBC、C-NBC、PKNN、D-NBC四种分类模型处理不同容量气象数逡逑据的预测正确率,对比它们在相同容量下的正确率。从图3-4可以看出,,当样本容量逡逑较少时,四种模型的预测性能接近,但是仍然T 以看出D-NBC模型的性能更好。从总逡逑体趋势来看,一方面,相比较C-NBC和D-NBC模型,经典NBC模型的性能最差,而逡逑且达到稳定状态的过程需要的样本容量较大,可见,对预测因子属性值进行离散化可逡逑以提高NBC模型的分类性能。当数据容量为200至400行时,C-NBC、D-NBC模型逡逑的分类正确率接近,无法通过预测结果直观的看出离散方法的好坏,主要是由于样本逡逑较少时,少数类样本数目极少,气象数据中类分布不平衡性不明显,本文提出的离散逡逑31逡逑
【学位授予单位】:南京信息工程大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:P457.6;TP181

【参考文献】

相关期刊论文 前10条

1 张晨阳;马志强;刘利民;常骏;李永利;;Hadoop下基于粗糙集与贝叶斯的气象数据挖掘研究[J];计算机应用与软件;2015年04期

2 韩芳;孙立民;;不平衡样本集分类算法研究[J];计算机应用研究;2015年08期

3 胡邦辉;刘善亮;席岩;王学忠;游大鸣;张惠君;;一种Bayes降水概率预报的最优子集算法[J];应用气象学报;2015年02期

4 彭昱忠;王谦;元昌安;林开平;;数据挖掘技术在气象预报研究中的应用[J];干旱气象;2015年01期

5 朱军;胡文波;;贝叶斯机器学习前沿进展综述[J];计算机研究与发展;2015年01期

6 张清华;王进;王国胤;;粗糙模糊集的近似表示[J];计算机学报;2015年07期

7 陈凯;王立松;;一种新的加权最近邻算法的降水预报试验[J];计算机仿真;2014年06期

8 贾娴;刘培玉;公伟;;基于改进属性加权的朴素贝叶斯入侵取证研究[J];计算机工程与应用;2013年07期

9 马勇;仝瑶瑶;程玉虎;;一种改进的最大相关最小冗余选择性贝叶斯分类器[J];北京科技大学学报;2012年01期

10 杨萍;杨天社;杜小宁;李济生;黄永宣;;一种基于类别属性关联程度最大化离散算法[J];控制与决策;2011年04期

相关硕士学位论文 前7条

1 李彩凤;不平衡数据的离散化算法及其并行化[D];哈尔滨工业大学;2017年

2 张永芳;基于Hadoop平台的并行数据挖掘算法研究[D];安徽理工大学;2016年

3 杜婷;基于属性选择的朴素贝叶斯分类研究与应用[D];中国科学技术大学;2016年

4 喻凯西;朴素贝叶斯分类算法的改进及其应用[D];北京林业大学;2016年

5 杨利娟;基于Hadoop云平台的数据挖掘技术在天气数据的应用研究[D];北京邮电大学;2015年

6 闫永刚;基于Hadoop的KNN分类在降水中的研究[D];南京信息工程大学;2013年

7 刘寅;Hadoop下基于贝叶斯分类的气象数据挖掘研究[D];南京信息工程大学;2012年



本文编号:2673211

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/qxxlw/2673211.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户78c21***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com