基于LSTM的城市出租车需求预测及其优化调度模型
发布时间:2020-12-25 08:24
出租车是城市公共交通中重要的交通工具,对缓解城市交通压力提供了强有力的支持。为了解决现阶段城市出租车运营中存在的空驶率高、寻客难的问题,很多工作提出了基于需求的出租车调度系统。但是,已有的调度算法只考虑到了实时需求数量与空载出租车数量之间的需求/供应关系,调度过程存在一定的时间延迟,并且没有考虑到载客出租车对调度系统的影响。本文对此问题进行深入的研究,从区域出租车需求预测和目的地预测两方面解决问题。本文在深圳市约15000辆出租车的轨迹数据上进行相关研究,该数据集时间跨度从2014年10月20日到2014年11月25日共37天,平均每天的轨迹数目为40万左右。本文主要的工作内容如下:1)针对城市交通工作日周期规律对区域出租车需求数量变化的影响,提出基于时间周期规律和空间关联特性的城市区域需求预测算法。以深圳市出租车数据为研究对象,构建需求预测模型的实验样本数据。使用二维卷积神经网络(Convolutional Neural Network,CNN)对区域及其周围区域进行需求分布空间特征挖掘,使用长短期记忆神经网络(Long Short-Term Memory,LSTM)对样本的时序依赖...
【文章来源】: 程浩 武汉理工大学
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
原始数据
13采样时间间隔大多为20秒或30秒,其中完整的载客轨迹的轨迹点个数平均为40~50。如图2-1所示,原始数据包含时间、车牌号、经纬度、速度、转角、运营状态等信息。经过预处理,可以得到图2-2所示的车辆完整轨迹。图2-2一条完整的出租车载客轨迹本章工作是对城市区域的需求量进行预测,预测结果的好坏使用平均百分比误差(MeanAbsolutePercentageError,MAPE)[45]和均方根误差(Root-Mean-SquareError,RMSE)[46],定义如下:11111||iittiityyMAPEyξξ++=+=(2-1)21111()iittiRMSEyyξξ++==(2-2)其中1ity+和+1ity表示区域i在时间间隔t+1时的预测值和真实值,ξ表示样本数。根据这两个评价指标可以评价模型在预测需求时产生的误差大小,误差越小说明模型预测的结果越好。2.1.2轨迹数据预处理原始轨迹数据根据时间进行采集,没有形成以车辆为单位的轨迹数据,需要将原始数据处理成轨迹数据。处理的算法流程为下:
15点之间的速度,一般发生漂移的点会在常规时间内发生跃迁现象,如果两点之间的距离除以时间不在常规范围内则认为发生了数据漂移现象。如图2-3所示。2.1.3城市区域出租车需求预测问题定义本文使用深圳市出租车轨迹数据作为需求预测研究对象,首先需要将轨迹数据转换为需求数据。出租车需求的落脚点在于区域,根据区域范围可以确定需求值。现有需求预测的研究[18,21,22,47]中,都把城市区域划分为网格形式,划分的标准根据城市大小的不同而不同。本文研究深圳市出租车轨迹数据,因此需要根据深圳市区域进行网格划分。深圳市东西范围横跨距离有92千米,南北范围横跨距离大概有46千米。本文将深圳市最大范围分为28×60个网格区域,并去除不在市区范围的网格,一共得到918个网格区域,每个网格的大小约为1.4×1.4千米。图2-4深圳市地图区域网格划分城市区域的需求每天随着时间动态变化,同一个区域不同时间需求值有所差异,这种变化显现出一定规律。合理的时间间隔划分能够准确地表示区域需求变化的这种规律。根据Zhang[48]等人对城市交通流的研究,把数据集时间间隔设为30分钟能够达到较好的效果。通过对深圳市出租车轨迹数据的统计,完整的载客轨迹所花费的时长平均在23分钟左右,也就是说平均每23分钟区域的需求就会发生变化,因此把时间间隔设为30分钟比较合理。图2-5是对深圳市某个商业区域一周的需求数据变化统计结果。通过图示发现,将时间间隔设为30分钟可以体现出相关的规律,比如周末凌晨的需求比工作日稍高,而7点到18点时间段的需求比工作日低,这与现实生活相符。因此,将时间间隔设为30分
【参考文献】:
期刊论文
[1]基于深度CNN-LSTM-ResNet组合模型的出租车需求预测[J]. 段宗涛,张凯,杨云,倪园园,SAURAB Bajgain. 交通运输系统工程与信息. 2018(04)
[2]基于增强学习的网格化出租车调度方法[J]. 何胜学. 计算机应用研究. 2019(03)
[3]基于人工鱼群算法的出租车智能调度[J]. 谢榕,潘维,柴崎亮介. 系统工程理论与实践. 2017(11)
[4]地理学第一定律与时空邻近度的提出[J]. 李小文,曹春香,常超一. 自然杂志. 2007(02)
博士论文
[1]面向校园疏散的均衡模型与疏导优化方法研究[D]. 段鹏飞.武汉理工大学 2013
本文编号:2937288
【文章来源】: 程浩 武汉理工大学
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
原始数据
13采样时间间隔大多为20秒或30秒,其中完整的载客轨迹的轨迹点个数平均为40~50。如图2-1所示,原始数据包含时间、车牌号、经纬度、速度、转角、运营状态等信息。经过预处理,可以得到图2-2所示的车辆完整轨迹。图2-2一条完整的出租车载客轨迹本章工作是对城市区域的需求量进行预测,预测结果的好坏使用平均百分比误差(MeanAbsolutePercentageError,MAPE)[45]和均方根误差(Root-Mean-SquareError,RMSE)[46],定义如下:11111||iittiityyMAPEyξξ++=+=(2-1)21111()iittiRMSEyyξξ++==(2-2)其中1ity+和+1ity表示区域i在时间间隔t+1时的预测值和真实值,ξ表示样本数。根据这两个评价指标可以评价模型在预测需求时产生的误差大小,误差越小说明模型预测的结果越好。2.1.2轨迹数据预处理原始轨迹数据根据时间进行采集,没有形成以车辆为单位的轨迹数据,需要将原始数据处理成轨迹数据。处理的算法流程为下:
15点之间的速度,一般发生漂移的点会在常规时间内发生跃迁现象,如果两点之间的距离除以时间不在常规范围内则认为发生了数据漂移现象。如图2-3所示。2.1.3城市区域出租车需求预测问题定义本文使用深圳市出租车轨迹数据作为需求预测研究对象,首先需要将轨迹数据转换为需求数据。出租车需求的落脚点在于区域,根据区域范围可以确定需求值。现有需求预测的研究[18,21,22,47]中,都把城市区域划分为网格形式,划分的标准根据城市大小的不同而不同。本文研究深圳市出租车轨迹数据,因此需要根据深圳市区域进行网格划分。深圳市东西范围横跨距离有92千米,南北范围横跨距离大概有46千米。本文将深圳市最大范围分为28×60个网格区域,并去除不在市区范围的网格,一共得到918个网格区域,每个网格的大小约为1.4×1.4千米。图2-4深圳市地图区域网格划分城市区域的需求每天随着时间动态变化,同一个区域不同时间需求值有所差异,这种变化显现出一定规律。合理的时间间隔划分能够准确地表示区域需求变化的这种规律。根据Zhang[48]等人对城市交通流的研究,把数据集时间间隔设为30分钟能够达到较好的效果。通过对深圳市出租车轨迹数据的统计,完整的载客轨迹所花费的时长平均在23分钟左右,也就是说平均每23分钟区域的需求就会发生变化,因此把时间间隔设为30分钟比较合理。图2-5是对深圳市某个商业区域一周的需求数据变化统计结果。通过图示发现,将时间间隔设为30分钟可以体现出相关的规律,比如周末凌晨的需求比工作日稍高,而7点到18点时间段的需求比工作日低,这与现实生活相符。因此,将时间间隔设为30分
【参考文献】:
期刊论文
[1]基于深度CNN-LSTM-ResNet组合模型的出租车需求预测[J]. 段宗涛,张凯,杨云,倪园园,SAURAB Bajgain. 交通运输系统工程与信息. 2018(04)
[2]基于增强学习的网格化出租车调度方法[J]. 何胜学. 计算机应用研究. 2019(03)
[3]基于人工鱼群算法的出租车智能调度[J]. 谢榕,潘维,柴崎亮介. 系统工程理论与实践. 2017(11)
[4]地理学第一定律与时空邻近度的提出[J]. 李小文,曹春香,常超一. 自然杂志. 2007(02)
博士论文
[1]面向校园疏散的均衡模型与疏导优化方法研究[D]. 段鹏飞.武汉理工大学 2013
本文编号:2937288
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/2937288.html