基于决策树的空气质量建模
发布时间:2024-04-25 05:31
为了更方便直观的预测空气质量,利用决策树算法建模。以天水市近三年空气质量数据为研究对象,借助scikit-learn平台对数据进行建模。采用交叉验证和网格搜索的调参手段,使剪枝效果达到最佳。结果表明,模型在测试数据上准确率可以达到94%,说明模型具有一定的预测价值。
【文章页数】:3 页
【部分图文】:
本文编号:3964079
【文章页数】:3 页
【部分图文】:
图1系统总体设计
对缺省数据进行处理等。1.3CART算法使用基尼指数准则用于决策树划分选择。决策树算法是一种预测模型,描述了对象属性与对象值之间的一种映射关系,是上个世纪60年代到70年代提出的一种用于数据分类的算法。自提出以来,就一直不断发展,精益求精,从ID3,ID4到CART决策树算法,再....
图2criterion算法学习曲线
使用相同的方法,得到其他参数的学习曲线。经过超参数学习曲线调整后,大概知道了数据的范围。然后利用网格搜索法搜索最佳的数值,其模型最佳参数组合如表2所示。图3max_depth学习曲线
图3max_depth学习曲线
图2criterion算法学习曲线表2网格搜索后的参数参数criterionmax_depthmin_samples_leafmin_samples_splitmax_features数值entropy4293
图1不调参的效果图
选取数据集的70%作为训练集,30%用作测试集。在不加限制情况下,一颗决策树可以生长到纯度最优,这样就会出现在训练集上效果很好,但是在测试集上效果很差的状况,把这种现象称为过拟合[2]。首先在不设置任何参数的情况下,查看决策树算法在训练集和测试集上的执行效果,如图1所示。从图中可....
本文编号:3964079
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3964079.html