大数据环境下的轨迹数据查询优化技术研究

发布时间:2021-08-02 22:37
  轨迹数据是指通过对移动对象运动过程的采样所形成的具有时空特征的数据信息。随着位置采集技术的不断发展和采集设备的大量部署,产生了越来越多的移动对象轨迹数据。这些轨迹数据可以用来交通规划,城市规划,兴趣推荐等,具有广泛的意义和重要的价值。如果希望使用轨迹数据进行数据分析和应用,快速高效的查询是必不可少的,而查询的效率通常与数据存储方式和索引结构有关。而存储方式和索引结构,与数据本身的质量息息相关。数据质量的好坏又与原始数据和数据预处理有关。进行数据分析,原始数据无法再进行优化,但细致的数据预处理能够使后续的分析工作更加快速和有效。因此,本文对轨迹分段、轨迹查询、轨迹索引三方面进行了详细的研究工作,设计并实现了分段算法,索引结构与查询算法。具体有如下三方面:1.结合轨迹数据的时空特性,提出了一种基于动态阈值的定点轨迹数据行程识别方法。首先,该方法采用聚类方法确定与阈值相关的时空多粒度参数;其次,根据参数对历史记录进行统计,计算参数对应阈值,最后,利用时空相关参数获取对应阈值,对轨迹进行分段,进而实现行程识别。基于真实的城市交通卡口数据的实验结果表明,使用时空相关的动态阈值方法对定点轨迹数据进... 

【文章来源】:北方工业大学北京市

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

大数据环境下的轨迹数据查询优化技术研究


轨迹数据处理范式

流程图,轨迹,阈值,动态


第四章基于行程识别的轨迹数据分段方法20第四章基于行程识别的轨迹数据分段方法本章给出一种基于行程识别的轨迹分段方法,针对定点轨迹数据,考虑到其离散度较高的特性,采用了速度阈值对轨迹进行分段。由于车辆的行驶速度会受到时空化影响,在轨迹分段时速度阈值应当考虑时空因素,本方法对阈值的采取了动态选取的方式,从而实现更高的分段精准度。4.1轨迹分段基本思路该方法在固定阈值的轨迹分段方法上进行了改进,针对不同时空情况,有不同的判断阈值。图4-1展示了该方法的主要流程,分为三个主要步骤:第一,对历史数据进行时空相关分析,确定参数选取的维度,再利用层次聚类的方法,对粒度进行划分,获取时空相关的阈值参数;第二,根据时空参数对历史数据进行分组,计算每组对应速度阈值;第三,将测试数据的时空参数与历史数据的参数进行匹配,获取速度阈值,作为判断轨迹分段的条件,以此实现轨迹分段,达到行程识别的目的。图4-1动态阈值的定点轨迹数据行程识别方法流程

示意图,平均速度,车辆,示意图


第四章基于行程识别的轨迹数据分段方法214.2速度阈值选取参数维度由于轨迹数据是一类特殊的时空数据,其数据都具有时空特性。对轨迹点之间的速度进行了时空相关性的分析。图4-22月1日15时车辆通过部分监测点的平均速度示意图图4-32月1车辆通过某路口监测点平均速度统计图4-2显示了同一时间下,通过不同监测点的平均速度,图中点越大表示通过该监测点的速度越大。图4-3显示了同一个检测点,不同时间段的平均速度。可以看出,空间和时间对于速度都有不同的影响,所以在设置阈值的时候参考时间空间两个属性。05101520253035401357911131517192123Velocity/km/hHour/h


本文编号:3318396

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3318396.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c1e83***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com