基于机器学习的共享单车需求量预测模型研究
发布时间:2020-05-29 18:42
【摘要】:自行车一直是城市交通中的一种重要工具,随着移动互联网时代的蓬勃发展,共享单车在城市交通出行中开始盛行,它在方便人们出行的同时也促进了共享经济的发展。但是不合理的投放对单车资源、厂家的经济利益以及城市市容都会造成很大的影响。本文通过对共享单车使用量的数据进行分析,设计了共享单车需求量的组合预测模型,通过预测单车的需求量指导单车的合理投放。主要的工作包括:对原始数据进行数据预处理并进行可视化分析,初步获得影响单车使用量的影响因素。在此基础上,通过向后移除法筛选特征,并结合可视化分析结论确定了最终构建模型所需要的实验数据。对传统预测算法进行了研究,重点研究了梯度提升(GBDT)算法、随机森林算法和BP神经网络算法,并使用之前确定的实验数据进行了单项预测模型的实践,实验结果表明,同一特征在GBDT预测模型和随机森林预测模型中其重要性是不同的,气温对单车需求量的影响最大,三个单项预测模型的R方值相近,预测准确度都有很大的提升空间。在此基础上,将三个单项预测模型进行组合设计了两种组合预测模型,一种是以预测误差绝对值之和达到最小的线性组合预测模型,另一种是以BP神经网络进行组合的非线性组合预测模型,对模型进行试验发现,两种组合预测模型准确度较单项预测模型都有提高,但非线性组合预测模型的预测效果更好,主要因为线性组合中的线性关系在某种程度上限制了组合模型的优化程度,组合模型中单项预测模型之间的关系具有一定的复杂性,不只是线性关系,而BP神经网络在满足线性关系的同时能够挖掘到其非线性的信息,使得模型的效果更好,其R方值较线性组合预测模型提高了0.02。因此,将以BP神经网络进行组合的非线性组合预测模型作为最终的共享单车需求量预测模型。
【图文】:
建立外表hql语句⑴去重处理,即删除原始数据中的重复数据
temp箱线图
【学位授予单位】:长安大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F713.36;F571;F274
本文编号:2687328
【图文】:
建立外表hql语句⑴去重处理,即删除原始数据中的重复数据
temp箱线图
【学位授予单位】:长安大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F713.36;F571;F274
【参考文献】
相关期刊论文 前4条
1 晏杰;;决策树算法的研究及其在大学生心理健康数据处理中的应用[J];江汉大学学报(自然科学版);2015年04期
2 周晨;冯宇东;肖匡心;韩珊;董颖;;基于多元线性回归模型的东北地区需水量分析[J];数学的实践与认识;2014年01期
3 刘晓斌;非线性组合预测人民币汇率变动方法研究[J];数理统计与管理;2002年02期
4 童其慧;主成分分析方法在指标综合评价中的应用[J];北京理工大学学报(社会科学版);2002年01期
相关硕士学位论文 前4条
1 周传钰;共享单车投放量测算和调度方法研究[D];北京交通大学;2018年
2 蒋雅婷;基于多元线性回归插值法研究中国区域积温演变[D];华东师范大学;2017年
3 张军梅;基于最大权重最小冗余准则的特征选择方法研究[D];大连理工大学;2016年
4 杜俊;半监督学习及其在社交媒体分析中的应用[D];华北电力大学;2015年
,本文编号:2687328
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2687328.html