基于Storm平台的城市道路交通拥堵识别研究
发布时间:2020-09-05 08:22
目前,严重的交通拥堵已成为大中型城市面临的突出问题,阻碍着新型城镇化建设的有序发展。随着城市交通拥堵形势的日益严峻,如何有效地识别区域内的交通状态成为智能交通研究中的一个热点。传统的识别方案基本是依靠感应线圈、摄像头等固定传感器组建交通状态检测网络,此类方法由于存在建设和维护成本高的局限,对整个城市路网达不到完全覆盖。而浮动车数据凭借其采集成本低、覆盖面广的优势逐渐成为最重要的交通数据来源。通过对浮动车轨迹数据的分析可以挖掘出交通流状态信息,从而实现对拥堵道路的准确识别。浮动车的数量在不断地增长,每天产生的定位信息数以亿计。海量的数据为传统的数据处理技术带来了挑战,如何提高系统的吞吐量和性能成为首要解决的问题,分布式计算的出现为大数据处理提供了新的解决方案。本文围绕如何利用出租车GPS数据进行交通拥堵识别的问题展开研究,所完成的主要工作如下:(1)将原始的出租车GPS数据进行预处理,包括数据清洗和地图匹配。介绍了数据的来源和格式,分析了影响GPS数据质量的无效数据和噪声数据的特征及清洗流程。在研究了现有的几种地图匹配算法基础上,采用隐马尔科夫模型(HMM)进行地图匹配,以修正偏离路段的轨迹点位置信息。(2)采用SAGA-FCM算法进行路段拥堵状态的识别。选取路段平均速度作为主要的拥堵识别指标,通过单辆车的平均速度估计出路段的平均速度。针对交通状态的模糊性,采用模糊C均值聚类算法(FCM)进行交通状态的模糊划分。由于FCM算法对初始值敏感且容易陷入局部最优,结合模拟退火遗传算法(SAGA)改进其不足。实验表明,在拥堵状态识别上SAGA-FCM算法比FCM算法准确度更高。(3)设计了一个基于Storm平台的拥堵识别系统。针对大规模GPS数据实时处理的问题,探讨了分布式流处理系统的架构。基于Storm平台,结合消息中间件和空间数据库,对SAGA-FCM拥堵识别算法进行实现。最后采用WebGIS相关技术,将城市路网和拥堵路段在网页上进行可视化展现。
【学位单位】:西华师范大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:U491.265
【部分图文】:
图 2-1 北京市路网Fig. 2-1 Road network of Beijing清洗 数据格式用的出租车 GPS 数据由出租车运营公司提供。每辆车每隔GPS 数据到数据中心,出于节约内存资源和通信带宽的考虑器的数据为二进制码流。通过对二进制流的解码可以得到-SeparatedValues,CSV)格式的 GPS 数据文件。文件每一行代,一行中采用逗号分割各个属性字段。一个时空采样点包含示。其中,需要说明的是采样时间戳的格式是 yyyyMMddH24 小时制。出租车的瞬时速度为千米/时(km/h),行驶方向顺时针旋转依次取值 0-360 度。载客状态有 0、1、2 三种取于空闲状态、载客状态和驻车状态。表 2-1 出租车 GPS 数据字段Table 2-1 The data field of GPS in Taxi
影点作为匹配点[34]。最短距离匹配算法实现简单,但在路段密集区域和交叉路容易造成较大的误差。因此在实际中不常用这种算法选择匹配路段,而是用作在经求得匹配路段的前提下直接投影找到匹配点。Quddus[35]等人提出了一种基于重的几何匹配算法,不仅考虑了待定位点和各路段的距离,还考虑了车辆方向与段方向的夹角。(2)概率统计匹配算法概率统计匹配算法最早由 Honey[36]等人提出,该算法的思想是设置一个置区域来选取匹配路段。当置信区域包含多条候选路段时,再根据车辆距离、速度方向等信息确定最优路段。概率统计匹配算法不要求车辆一定在路段上,当置信域内没有候选路段时,算法认为车辆不在道路上。(3)模糊逻辑匹配算法模糊逻辑匹配算法借助隶属度函数来描述候选路段的误差模型。宋洁[37]等提出了有关模糊逻辑算法的改进,选择距离、速度和方向作为评判因子,分别定其隶属函数,计算出模糊向量和权向量,最后做模糊变换得到距离、速度和方向自的权重值。模糊逻辑算法的优点是具有较高的匹配准确度,并且适用于多种路
第 3 章 基于模糊聚类的交通拥堵识别算法A-F 六个等级,主要衡量自由流速度、密度和流量三个指标[49]。如图 3.1 所示,LO被分为六个区间,图中坐标系纵轴为交通流量,表示一段道路上每小时通过的车辆数,各区间分割线斜率的的倒数为交通流密度,表示一段道路上每英里通过的车辆数。此外,一些州根据自身情况采用一些其他的参数来评判交通拥堵,如德州使用同一条路段上车辆的实际行驶时间和自由交通流通过路段的时间的比值来量化拥堵程度,芝加哥将 5min 内车道占用率超过 30%的交通状态判定为发生拥堵。
【学位单位】:西华师范大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:U491.265
【部分图文】:
图 2-1 北京市路网Fig. 2-1 Road network of Beijing清洗 数据格式用的出租车 GPS 数据由出租车运营公司提供。每辆车每隔GPS 数据到数据中心,出于节约内存资源和通信带宽的考虑器的数据为二进制码流。通过对二进制流的解码可以得到-SeparatedValues,CSV)格式的 GPS 数据文件。文件每一行代,一行中采用逗号分割各个属性字段。一个时空采样点包含示。其中,需要说明的是采样时间戳的格式是 yyyyMMddH24 小时制。出租车的瞬时速度为千米/时(km/h),行驶方向顺时针旋转依次取值 0-360 度。载客状态有 0、1、2 三种取于空闲状态、载客状态和驻车状态。表 2-1 出租车 GPS 数据字段Table 2-1 The data field of GPS in Taxi
影点作为匹配点[34]。最短距离匹配算法实现简单,但在路段密集区域和交叉路容易造成较大的误差。因此在实际中不常用这种算法选择匹配路段,而是用作在经求得匹配路段的前提下直接投影找到匹配点。Quddus[35]等人提出了一种基于重的几何匹配算法,不仅考虑了待定位点和各路段的距离,还考虑了车辆方向与段方向的夹角。(2)概率统计匹配算法概率统计匹配算法最早由 Honey[36]等人提出,该算法的思想是设置一个置区域来选取匹配路段。当置信区域包含多条候选路段时,再根据车辆距离、速度方向等信息确定最优路段。概率统计匹配算法不要求车辆一定在路段上,当置信域内没有候选路段时,算法认为车辆不在道路上。(3)模糊逻辑匹配算法模糊逻辑匹配算法借助隶属度函数来描述候选路段的误差模型。宋洁[37]等提出了有关模糊逻辑算法的改进,选择距离、速度和方向作为评判因子,分别定其隶属函数,计算出模糊向量和权向量,最后做模糊变换得到距离、速度和方向自的权重值。模糊逻辑算法的优点是具有较高的匹配准确度,并且适用于多种路
第 3 章 基于模糊聚类的交通拥堵识别算法A-F 六个等级,主要衡量自由流速度、密度和流量三个指标[49]。如图 3.1 所示,LO被分为六个区间,图中坐标系纵轴为交通流量,表示一段道路上每小时通过的车辆数,各区间分割线斜率的的倒数为交通流密度,表示一段道路上每英里通过的车辆数。此外,一些州根据自身情况采用一些其他的参数来评判交通拥堵,如德州使用同一条路段上车辆的实际行驶时间和自由交通流通过路段的时间的比值来量化拥堵程度,芝加哥将 5min 内车道占用率超过 30%的交通状态判定为发生拥堵。
【参考文献】
相关期刊论文 前7条
1 许佳捷;郑凯;池明e
本文编号:2812787
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/2812787.html