基于XGBoost集成学习算法的电动汽车价格预测
发布时间:2021-03-27 00:20
针对电动汽车属性及价格的数据集,采用XGBoost集成学习算法进行电动汽车价格的分类和预测。首先,在Matlab和Python环境中,使用经过预处理的训练数据训练得到XGBoost分类和预测模型。然后,用训练所得XGBoost模型对测试数据进行价格预测,在准确率、召回率、F-score和混淆矩阵等方面对XGBoost算法进行测试,并与支持向量机和神经网络等算法做了对比实验。实验结果证明,三种预测模型预测准确率均在95%以上,XGBoost算法的预测效果最佳。最后,结合各预测模型的原理,对XGBoost预测模型的优缺点进行分析,并提出了模型的改进方向。
【文章来源】:江苏理工学院学报. 2020,26(06)
【文章页数】:11 页
【部分图文】:
箱型图检测异常值结果
第6期蔡秋茹:基于XGBoost集成学习算法的电动汽车价格预测3711.3.2相关性分析首先,通过绘制散点图的方式,直观地判断两个变量是否具有线性相关关系。电动汽车属性散点图如图3所示。观察图3可知,这些属性两两之间不具有线性相关关系。(a)电池可以一次性存储的总能量/mAh(b)微处理器执行指令的速度(c)前置摄像头百万像素(d)内存/GB(e)移动深度/cm(f)重量/g图2电动汽车属性定量变量分布图5506507508509501050115012501350145015501650175018501950
第6期蔡秋茹:基于XGBoost集成学习算法的电动汽车价格预测39组,一部分作为训练集,另一部分作为验证集。先用训练集对分类器进行训练,再用验证集测试训练得到的模型,以此作为评价分类器性能的指标。本文采用5折交叉验证法,可以在样本数据量不足的情况下充分利用所有样本挖掘出数据中的有用信息。图4分类模型的实现步骤22.1.3多分类问题的求解思路(1)OvO策略对4种类型的样本进行分类时,分别取一种样本作为一类,将剩余所有类型的样本看作另一类,这样就形成了4个二分类问题。使用二分类算法对4个数据集训练出4个模型,将待预测的样本传入这4个模型中,所得概率最高的那个模型对应的样本类型即为该预测样本的类型,OvO策略示意图如图5所示。图5OvO策略示意图(2)OvR策略对4种类型的样本进行分类时,每次挑出2种类型两两结合,共有C24=6种二分类情况。用这6种模型预测样本类型,得到6个预测结果,种类最多的样本类型即为该样本最终的预测类型。OvR策略示意图如图6所示。图6OvR策略示意图
本文编号:3102511
【文章来源】:江苏理工学院学报. 2020,26(06)
【文章页数】:11 页
【部分图文】:
箱型图检测异常值结果
第6期蔡秋茹:基于XGBoost集成学习算法的电动汽车价格预测3711.3.2相关性分析首先,通过绘制散点图的方式,直观地判断两个变量是否具有线性相关关系。电动汽车属性散点图如图3所示。观察图3可知,这些属性两两之间不具有线性相关关系。(a)电池可以一次性存储的总能量/mAh(b)微处理器执行指令的速度(c)前置摄像头百万像素(d)内存/GB(e)移动深度/cm(f)重量/g图2电动汽车属性定量变量分布图5506507508509501050115012501350145015501650175018501950
第6期蔡秋茹:基于XGBoost集成学习算法的电动汽车价格预测39组,一部分作为训练集,另一部分作为验证集。先用训练集对分类器进行训练,再用验证集测试训练得到的模型,以此作为评价分类器性能的指标。本文采用5折交叉验证法,可以在样本数据量不足的情况下充分利用所有样本挖掘出数据中的有用信息。图4分类模型的实现步骤22.1.3多分类问题的求解思路(1)OvO策略对4种类型的样本进行分类时,分别取一种样本作为一类,将剩余所有类型的样本看作另一类,这样就形成了4个二分类问题。使用二分类算法对4个数据集训练出4个模型,将待预测的样本传入这4个模型中,所得概率最高的那个模型对应的样本类型即为该预测样本的类型,OvO策略示意图如图5所示。图5OvO策略示意图(2)OvR策略对4种类型的样本进行分类时,每次挑出2种类型两两结合,共有C24=6种二分类情况。用这6种模型预测样本类型,得到6个预测结果,种类最多的样本类型即为该样本最终的预测类型。OvR策略示意图如图6所示。图6OvR策略示意图
本文编号:3102511
本文链接:https://www.wllwen.com/kejilunwen/qiche/3102511.html