基于数据挖掘的城市共享单车出行分析及区域需求量预测
发布时间:2023-03-02 20:27
共享单车作为新兴的“互联网+交通”的出行方式,不仅缓解了城市的噪音污染和交通拥堵,而且凭借其灵活方便、低碳环保、经济节能、可达性好的优势,已经逐渐成为解决城市“最后一公里”出行的首选方式。但其独有的特征给用户和运营商带来了许多问题,例如区域单车投放量不合理、高峰时段各区域车辆供需不平衡、运营管理收支不平衡等等。解决这些问题的关键在于对区域未来单车需求量的分析和预测,这对共享单车的车辆调度和运营商的运营管理有着十分重要的意义。本文首先对共享单车数据进行可视化分析,包括租借量的分布情况、时间特征(如季节、月份、小时等)对租车量的影响、环境特征(如温度、湿度、风速等)对租车量的影响等。然后,在特征工程部分对数据的空缺异常值进行填充,并由可视化分析结果进行特征构造,时间因子对租车量的影响较为明显,于是基于时间属性构造了租车量时间特征、环境时间特征和周期性特征等,另外,针对一天中的早晚高峰期时段的特性也构造了一系列特征,并进行特征选择。最后,分别建立支持向量机回归模型、随机森林回归模型和GBDT回归模型对共享单车的需求量进行预测。并利用stacking方法将三个模型进行融合,提出建立一种SSRG...
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文主要研究内容与章节安排
第二章 共享单车数据可视化分析
2.1 数据介绍
2.2 数据可视化分析
2.2.1 查找异常值
2.2.2 各个特征之间的相关性
2.2.3 时间特征对用户出行租车的影响
2.2.4 环境因素对租车量的影响
2.3 本章小结
第三章 特征工程
3.1 数据清洗
3.1.1 缺失值的处理
3.1.2 异常值(离群点)的处理
3.2 特征构造
3.2.1 常规特征构造
3.2.2 复杂特征构造
3.2.3 其它特征构造
3.3 特征选择
3.4 特征处理
3.4.1 数值型特征处理
3.4.2 类别型特征处理
3.5 本章小结
第四章 模型算法原理及评价指标
4.1 基本模型算法原理
4.1.1 支持向量机
4.1.2 随机森林
4.1.3 梯度提升决策树
4.2 评价标准
4.3 本章小结
第五章 模型的建立和优化及预测结果分析
5.1 建模过程
5.2 模型参数调优
5.2.1 支持向量机回归模型参数调优
5.2.2 随机森林回归模型参数调优
5.2.3 梯度提升回归模型参数调优
5.3 模型融合构建SSRG预测模型
5.4 预测结果分析
5.5 本章小结
结论和展望
工作总结
工作展望
参考文献
攻读学位期间的科研成果
致谢
本文编号:3752573
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文主要研究内容与章节安排
第二章 共享单车数据可视化分析
2.1 数据介绍
2.2 数据可视化分析
2.2.1 查找异常值
2.2.2 各个特征之间的相关性
2.2.3 时间特征对用户出行租车的影响
2.2.4 环境因素对租车量的影响
2.3 本章小结
第三章 特征工程
3.1 数据清洗
3.1.1 缺失值的处理
3.1.2 异常值(离群点)的处理
3.2 特征构造
3.2.1 常规特征构造
3.2.2 复杂特征构造
3.2.3 其它特征构造
3.3 特征选择
3.4 特征处理
3.4.1 数值型特征处理
3.4.2 类别型特征处理
3.5 本章小结
第四章 模型算法原理及评价指标
4.1 基本模型算法原理
4.1.1 支持向量机
4.1.2 随机森林
4.1.3 梯度提升决策树
4.2 评价标准
4.3 本章小结
第五章 模型的建立和优化及预测结果分析
5.1 建模过程
5.2 模型参数调优
5.2.1 支持向量机回归模型参数调优
5.2.2 随机森林回归模型参数调优
5.2.3 梯度提升回归模型参数调优
5.3 模型融合构建SSRG预测模型
5.4 预测结果分析
5.5 本章小结
结论和展望
工作总结
工作展望
参考文献
攻读学位期间的科研成果
致谢
本文编号:3752573
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3752573.html