基于少数类过采样的马尾松毛虫发生面积等级预测算法及应用

发布时间:2024-01-31 01:35
  马尾松毛虫虫害是我国重要的森林病虫害之一,准确的预测预报能有效降低病虫害防治工作成本,提高防治效果。基于经典机器学习算法的林业病虫害预测预报方法无法有效处理样本数量少、分布不均衡、特征维度高的虫害数据,因而在预测样本数量较少的严重级别虫害时准确性有限。少数类过采样能够有效增加模型训练中可用样本的数量、平衡样本空间数据分布,可为林业病虫害准确稳定预测提供思路。因而,本文面向实际林业病虫害防治预警任务需求,针对虫害数据的不平衡性展开研究,重点解决了运用传统机器学习方法建立虫害发生面积等级预测模型时因数据不平衡所导致少数类样本的预测精度有限、泛化能力弱的问题,本文的主要研究工作如下:1.设计了一种马尾松毛虫虫害样本数据库。本文通过国家林业病虫害防治总站和国家气象数据共享中心搜集了广东省4个地区的马尾松毛虫历年发生面积、气象因子等数据,采用组合特征工程对特征数据进行筛选,明确了不同地区影响马尾松毛虫虫害发生的气象因素,为马尾松毛虫虫害发生面积等级预测算法研究的开展提供了素材。2提出了一种基于少数类过采样的马尾松毛虫发生等级预测算法。本文基于合成少数类过采样算法,结合样本排序、自调参k-近邻搜索...

【文章页数】:74 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 林业病虫害测报方法研究现状
        1.2.2 不平衡数据分类研究现状
    1.3 论文主要研究内容
    1.4 论文结构安排
2 马尾松毛虫虫害数据库的建立
    2.1 虫害搜集区域概况
    2.2 数据搜集
        2.2.1 虫害数据
        2.2.2 气象因子
        2.2.3 林分因子
        2.2.4 人为活动因子
    2.3 数据处理
        2.3.1 数据预处理
        2.3.2 特征选择
    2.4 本章小结
3 基于少数类过采样预测分类模型的构建
    3.1 不平衡数据概述
        3.1.1 不平衡数据的本质
        3.1.2 不平衡数据分类困难原因
    3.2 合成少数类过采样算法
    3.3 基于自调参的改进合成少数类算法
        3.3.1 样本排序
        3.3.2 自适应k值最近邻搜索算法
    3.4 算法的综合与调参
        3.4.1 算法描述
        3.4.2 样本合成
        3.4.3 样本权值更新
        3.4.4 训练误差的界
        3.4.5 参数β的选择
    3.5 本章小结
4 分类预测模型实验验证与分析
    4.1 模型性能评估指标
        4.1.1 F-measure准则
        4.1.2 G-mean准则
        4.1.3 ROC曲线及AUC值
    4.2 UCI公共数据集实验
        4.2.1 数据集描述
        4.2.2 实验方案设计
        4.2.3 实验结果与分析
    4.3 虫害数据集实验
        4.3.1 数据准备及实验方法
        4.3.2 实验结果与分析
    4.4 本章小结
5 马尾松毛虫虫害测报软件的设计与实现
    5.1 软件开发工具
        5.1.1 实现平台概述
        5.1.2 Tkinter模块概述
    5.2 软件设计及开发方法
        5.2.1 软件设计基本思路
        5.2.2 软件开发基本步骤
    5.3 软件关键功能实现
        5.3.1 主界面
        5.3.2 输入数据预测界面
        5.3.3 上传文件预测界面
    5.4 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
参考文献
个人简介
导师简介
攻读硕士学位期间获得成果目录清单
致谢



本文编号:3890725

资料下载
论文发表

本文链接:https://www.wllwen.com/nykjlw/dzwbhlw/3890725.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b4999***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com