城市区域流量短期预测方法研究
发布时间:2020-03-19 18:28
【摘要】:随着我国城市化进程的加快、物联网时代的到来,越来越多的多源、异构的数据可以被获取到,这些数据为实现有效的城市区域流量预测提供了可能。城市区域流量预测是指通过技术手段,有效的利用获取到的数据去预测未来短时城市区域流量,对城市的道路规划、交通管理以及安全预警等具有重要作用。区域流量预测是一个多因素影响的时空序列预测问题,具有高维、强非线性等特点,时间维和空间维的挖掘增加了区域流量预测任务的复杂性,使该任务的研究更具有挑战性。正因为如此,研究合理有效的城市区域流量预测方法显得尤为重要。本文从影响区域流量多种因素的角度出发进行了深入的研究,主要以机器学习和深度学习为核心研究方法,具体的研究工作如下:1)针对城市区域流量受多因素影响的这一特征,给出了一种基于梯度提升树(GBDT)的城市区域流量相关因素分析方法。首先对区域流量数据集进行了描述和统计分析,然后通过特征提取,利用已有的时空数据集构造新的数据集。实验结果表明GBDT方法可以实现对区域流量的有效预测,同时对特征重要度进行了分析,给出了相关因素序列,为后续的研究提供了基础。2)针对城市区域流量的时间依赖和空间相关问题分别进行了研究,提出了基于时间依赖性LSTM网络实现城市区域流量的预测方法,给定不同的输入形式,利用长短期记忆(LSTM)神经网络获取数据的时间依赖性。实验结果表明区域流量具有长期时间依赖的特点,以时间统计特征作为输入更加合理有效。然后又提出了基于空间相关性卷积LSTM网络实现城市区域流量的预测方法,该方法沿用时间统计特征作为输入,在LSTM网络的基础上增加了卷积操作。实验结果表明,相比于LSTM方法,卷积有效的获取到空间相关性,避免了空间特征的冗余,时空属性考虑较为全面,同时两种方法均实现了端到端的预测。3)针对外部事件对区域流量的影响以及更好的挖掘数据的时空特性,提出了基于多源数据融合与CRNN相结合的城市区域流量预测方法,该方法通过CNN和RNN的组合来挖掘数据的空间相关性,同时考虑到外部事件对于区域流量的影响,以全连接网络的方式实现外部特征的挖掘。实验结果表明,卷积递归神经网络(CRNN)可以提取数据的空间特征,相比于Conv LSTM方法,提取能力更强,同时外部特征的融入有效提升了方法的预测精度。
【图文】:
图 1-1 本文的主要研究内容1)通过对区域流量时空数据集和实际问题进行分析,说明城市区域流量受多因素影响这一特征,针对该特性,实现了一种基于梯度提升树(GradientBoosting Decision Tree,GBDT)的城市区域流量短期预测方法。该方法通过给定的特征提取方法,利用已有的时空数据集构造新的数据集,然后在新的训练集上有监督的训练 GBDT 模型,对城市某一区域流量进行预测,,评估预测结果,对影响区域流量的相关因素做出详细分析,并根据特征的重要程度给出影响因素序列,为后续的研究工作提供了基础。2)针对城市区域流量的时间依赖性和空间相关性问题分别进行了研究,首先提出了基于时间依赖性 LSTM 网络实现城市区域流量预测的方法,给定两种不同的输入形式,分别为临近性输入和时间统计特征输入,利用长短期记忆(LSTM)神经网络获取数据的时间依赖性。实验结果表明区域流量具有长期时间依赖的特点,以时间统计特征作为输入更加合理有效。然后又提出了基于空间相关性卷积 LSTM 网络实现城市区域流量预测的方法,该方法沿用时间统计特征作为输入,将 LSTM 网络结构中 input to state 和 state to
每个小格子代表一个城市区域,以半小时为时间戳,将 GPS 轨迹分好的区域里进行统计,为了分析问题的全面性,在每个小格子 inflow 和 outflow 两种数据,inflow 表示流入信息,定义为上一区域,当前时间段在该区域的个体数量。outflow 表示流出信息,间段在该区域,当前时间段不在该区域的个体数量。每个时间段半小时为时间戳统计,比如一天 24 个小时将统计 48 个时间戳的数 outflow 的形式化定义如公式(2-11)和(2-12)所示。其中tx 表段的数据;i 和 j 表示分割成 32*32 格子后,区域的坐标,也就是;P 表示第 t 个时间段的目标的轨迹集合;kg 表示 k 时刻的目标inflow: inf , ,11 ( , ) ( , )low i jt k kTr Px k g i j g i j (2outflow: , ,11 ( , ) ( , )outflow i jt k kTr Px k g i j g i j (2据集包含的时空数据形式如图 2-1 所示,其中时间维度上的每一格都对应映射好的城市范围区域流量。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F299.2;F49
本文编号:2590545
【图文】:
图 1-1 本文的主要研究内容1)通过对区域流量时空数据集和实际问题进行分析,说明城市区域流量受多因素影响这一特征,针对该特性,实现了一种基于梯度提升树(GradientBoosting Decision Tree,GBDT)的城市区域流量短期预测方法。该方法通过给定的特征提取方法,利用已有的时空数据集构造新的数据集,然后在新的训练集上有监督的训练 GBDT 模型,对城市某一区域流量进行预测,,评估预测结果,对影响区域流量的相关因素做出详细分析,并根据特征的重要程度给出影响因素序列,为后续的研究工作提供了基础。2)针对城市区域流量的时间依赖性和空间相关性问题分别进行了研究,首先提出了基于时间依赖性 LSTM 网络实现城市区域流量预测的方法,给定两种不同的输入形式,分别为临近性输入和时间统计特征输入,利用长短期记忆(LSTM)神经网络获取数据的时间依赖性。实验结果表明区域流量具有长期时间依赖的特点,以时间统计特征作为输入更加合理有效。然后又提出了基于空间相关性卷积 LSTM 网络实现城市区域流量预测的方法,该方法沿用时间统计特征作为输入,将 LSTM 网络结构中 input to state 和 state to
每个小格子代表一个城市区域,以半小时为时间戳,将 GPS 轨迹分好的区域里进行统计,为了分析问题的全面性,在每个小格子 inflow 和 outflow 两种数据,inflow 表示流入信息,定义为上一区域,当前时间段在该区域的个体数量。outflow 表示流出信息,间段在该区域,当前时间段不在该区域的个体数量。每个时间段半小时为时间戳统计,比如一天 24 个小时将统计 48 个时间戳的数 outflow 的形式化定义如公式(2-11)和(2-12)所示。其中tx 表段的数据;i 和 j 表示分割成 32*32 格子后,区域的坐标,也就是;P 表示第 t 个时间段的目标的轨迹集合;kg 表示 k 时刻的目标inflow: inf , ,11 ( , ) ( , )low i jt k kTr Px k g i j g i j (2outflow: , ,11 ( , ) ( , )outflow i jt k kTr Px k g i j g i j (2据集包含的时空数据形式如图 2-1 所示,其中时间维度上的每一格都对应映射好的城市范围区域流量。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F299.2;F49
【参考文献】
相关期刊论文 前1条
1 刘大有;陈慧灵;齐红;杨博;;时空数据挖掘研究进展[J];计算机研究与发展;2013年02期
本文编号:2590545
本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/2590545.html