数据驱动的高速公路交通流量及行程时间短时预测方法研究
发布时间:2020-07-28 22:05
【摘要】:交通流量及行程时间短时预测是智能交通系统实施的基础,准确有效的交通流量及行程时间短时预测不仅可以让出行者提前了解路况信息,安排好出行线路,节约出行成本,也可以帮助相关交通管理部门提前了解交通变化趋势,做好诱导工作,充分利用好现有道路资源,减少交通拥堵现象。此外,由于高速公路短时交通流具有强非线性、不确定性、时变性等特性,所以,如何对高速公路的交通流量及行程时间进行实时准确地短时预测是一个既具有挑战性又具有重要研究意义的问题。本文以高速公路海量收费流水数据为基础,重点研究了高速公路交通流量及行程时间短时预测问题,主要研究内容及创新如下:(1)为了给高速公路交通流量及行程时间短时预测奠定可靠的数据基础,本文对高速公路原始收费流水数据进行了分析总结并给出了数据异常的识别与处理方法。通过分析发现数据存在冗余、缺失以及错误等异常情况。对于数据冗余情况,采用直接删除法处理;对于数据缺失的情况,根据数据连续缺失的周期的长短分别采用加权平均法和K近邻非参数回归算法进行补偿;对于数据错误的情况,根据是行驶里程数据错误还是行程时间错误分别采用路段信息修复法和循环删除不在区间[?-2?,?(10)2?]内的数据的方法进行处理,其中?为样本均值,?为标准差。(2)为了提高高速公路交通流量短时预测的精度和稳定性,本文提出了基于多特征GBDT的高速公路交通流量短时预测模型。本文首次将梯度提升树(Gradient Boosting Decision Tree,GBDT)模型应用到交通流量短时预测问题上并通过分析高速公路短时交通流量的影响因素,挖掘出了天气、时段等几个有效的新特征,在此基础上构建了基于多特征GBDT的短时交通流量预测模型。最后通过广州机场高速的实际数据验证了多特征GBDT模型的有效性。(3)为了提高高速公路行程时间短时预测的精度和稳定性,本文提出了基于TS-SVR的高速公路行程时间短时预测模型。根据交通流理论可知行程时间和交通流量具有密切的联系,因此,本文将行程时间短时预测与交通流量短时预测结合:首先预测下一时段的交通流量,然后将下一时段的交通流量作为特征加入到基于支持向量机回归(Support Vector Regression,SVR)的行程时间短时预测模型的输入向量中,以此构建了基于TSSVR(Two Step-Support Vector Regression,TS-SVR)的高速公路行程时间短时预测模型。最后通过广州机场高速的实际数据验证了本文提出的模型的有效性。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:U491
【图文】:
图 2-2 广州机场高速 8 月份 4 个星期流量走势(2) 随机性由于人们的驾驶偏好的不同、出行的目的不同以及每条高速公路都有多个进出口所以人们出行的路线就会大不相同,这就会导致交通需求出现随机性,从而导致交通出现随机性。(3) 波动性由于交通临时管制、交通事故以及恶劣天气等客观因素的存在,会使得交通流的定性受到影响,从而出现波动性。
华南理工大学硕士学位论文四天不一致是因为 8 月 2 号广州在台风天气的影响下,交通流出现了波动。(4) 连续性从宏观上看,高速公路的交通流具有流体的特性。如图 2-3 所示,可以看出高速路的交通流量明显的呈连续状态,即在时间上是连续的。(5) 不均匀性由于受人们生活习惯等因素的影响,使得交通流存在不均匀的现象。一般来说,通流在白天时会比较稠密,且会出现两次高峰,到了晚上,交通流就会比较稀疏,交相对白天就会通畅很多。
所以,本章首先对基础数据展开分析,然后对收费数据异常情况进行分析并提出异常识别方法,最后说明异常数据的处理方法。3.1 基础数据分析目前,我国的高速公路均采用封闭、收费的管理模式,其收费数据管理系统主要由收费车道、互联网收费系统以及收费站组成[73-74]。收费数据管理系统会根据不同车辆的行程时间、行驶里程以及其车型等信息进行行车收费,所以高速公路收费数据管理系统会在短时间内积累大量的收费数据。因此,高速公路收费数据采集系统也是一个资源丰富的交通信息采集系统。本论文研究的数据是广东省高速公路收费流水数据,收费数据涵盖了入口区域编码、入口站名、入口时间、入口车道类型、车型、车种、出口区域编码、出口站名、出口时间、出口车道类型等与收费相关的数据。收费流水数据的原始字段信息如下表 3-1 所示。广东省高速公路部分收费流水数据如图 3-1 所示:
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:U491
【图文】:
图 2-2 广州机场高速 8 月份 4 个星期流量走势(2) 随机性由于人们的驾驶偏好的不同、出行的目的不同以及每条高速公路都有多个进出口所以人们出行的路线就会大不相同,这就会导致交通需求出现随机性,从而导致交通出现随机性。(3) 波动性由于交通临时管制、交通事故以及恶劣天气等客观因素的存在,会使得交通流的定性受到影响,从而出现波动性。
华南理工大学硕士学位论文四天不一致是因为 8 月 2 号广州在台风天气的影响下,交通流出现了波动。(4) 连续性从宏观上看,高速公路的交通流具有流体的特性。如图 2-3 所示,可以看出高速路的交通流量明显的呈连续状态,即在时间上是连续的。(5) 不均匀性由于受人们生活习惯等因素的影响,使得交通流存在不均匀的现象。一般来说,通流在白天时会比较稠密,且会出现两次高峰,到了晚上,交通流就会比较稀疏,交相对白天就会通畅很多。
所以,本章首先对基础数据展开分析,然后对收费数据异常情况进行分析并提出异常识别方法,最后说明异常数据的处理方法。3.1 基础数据分析目前,我国的高速公路均采用封闭、收费的管理模式,其收费数据管理系统主要由收费车道、互联网收费系统以及收费站组成[73-74]。收费数据管理系统会根据不同车辆的行程时间、行驶里程以及其车型等信息进行行车收费,所以高速公路收费数据管理系统会在短时间内积累大量的收费数据。因此,高速公路收费数据采集系统也是一个资源丰富的交通信息采集系统。本论文研究的数据是广东省高速公路收费流水数据,收费数据涵盖了入口区域编码、入口站名、入口时间、入口车道类型、车型、车种、出口区域编码、出口站名、出口时间、出口车道类型等与收费相关的数据。收费流水数据的原始字段信息如下表 3-1 所示。广东省高速公路部分收费流水数据如图 3-1 所示:
【参考文献】
相关期刊论文 前10条
1 王珂;田瑞;王菲菲;;基于灰色遗传支持向量机的短时交通流预测[J];武汉理工大学学报(交通科学与工程版);2014年05期
2 伊良忠;章超;裴峥;;广义回归神经网络的改进及在交通预测中的应用[J];山东大学学报(工学版);2013年01期
3 王树洋;黄天民;方新;;基于PSO-SVM的交通流量短时预测[J];重庆交通大学学报(自然科学版);2012年04期
4 张雄飞;李瑞敏;李宏发;史其信;;基于Monte Carlo的行程时间可靠性研究[J];武汉理工大学学报(交通科学与工程版);2012年04期
5 高敏;;交通流基本参数关系模型研究[J];中国水运(下半月刊);2010年12期
6 张涛;陈先;谢美萍;张sソ
本文编号:2773497
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/2773497.html