轨迹相似性查询算法研究
发布时间:2022-02-15 17:05
随着全球定位技术和无线通信网络的快速发展,通过移动终端获取大量轨迹数据成为可能。然而,轨迹数据存在规模大、质量低、采样率不同等问题,这直接影响了轨迹数据的挖掘效果和计算效率。学术界为了应对这些问题,在轨迹数据管理方面开展了大量研究工作。其中,轨迹的相似性查询问题是近年来学术界的研究热点之一。该研究主要包含两个核心问题:轨迹的相似性度量方法和相应的查询算法。前者决定查询结果的相似性效果,后者决定相似性查询的计算效率。本文以时空轨迹和语义轨迹作为对象,分别研究这两种轨迹的相似性查询方法,并取得了如下成果。1.提出了针对采样点分布不均的时空轨迹相似性查询算法。大部分的时空轨迹相似性度量方法对采样点的分布较为敏感。由于移动对象的运动速度无法保持恒定,可能引起轨迹的采样点分布不均。相对于采样点稀疏的轨迹段,密集轨迹段的相似性度量在最终度量结果中的比重会被夸大,这将影响时空轨迹相似性查询的最终结果。为了应对此问题,提出基于相似子轨迹计算相似度的时空轨迹相似性查询算法,不再以轨迹点为主体计算时空轨迹的相似度。此外,本文采用“过滤-验证”的计算框架提升时空轨迹的查询效率。过滤阶段利用相似子轨迹中相似轨...
【文章来源】:南京师范大学江苏省211工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
图2-1轨迹中的噪声数据M??(1)中值或均值滤波??
噪声点很容易发现。然后基于噪声点再次探测距离阈值之内的邻近轨迹点是否为??异常点。虽然该方法能够处理初始误差问题和数据稀疏问题,但是速度阈值和距??阈值的设置仍然基于启发式算法。??2.停留点检测??轨迹中各个轨迹点的重要程度通常是不相同的。有些轨迹点描述了人们停留??的位置,例如商场、景区和汽车加油的加油站。这类点被称为“停留点”。停留??点主要分为两类,一类是用户在一段时间内停留在一个位置上,保持静止,如图??2-2⑻中的“StayPoint?1”所示。这类情况非常稀少,由于GPS等定位设备的精??确性有限,同一个定位设备在同一个位置的不同时刻往往会有不同的位置信息。??二类停留点在轨迹中较为常见,通常会在一个区域内部移动或围绕某个区域移??动,如图2-2(a)中的“StayP〇int2”所示,图2-2(b)和(c)也属于第二类停留点。??以通过计算连续轨迹点的空间距离和时间间隔进行判断,具体方法可在文献??[51]中查找。找出停留点之后,可以将轨迹转化为带有时间标记的停留点序列,??通过分析停留的信息,可用于各种应用,例如旅行路线推荐、目标地点预测、出??车推荐和估计汽油消费等。此外,在一些其他应用中则需要将停留点去除,例??如计算路径行驶时间和行驶方向的智能推荐。??in1ark
在城市路口处车速放缓,因而轨迹采样点较密:在高速路段,由于车速较快,因??而采样点较疏。采样点的密度不均会影响轨迹相似性度量(Euclid_,LCSS[24'M],??DTW[63],EDR[气ERP[66^)的结果。如图3-1所示,有三组相同的轨迹,第①??组的轨迹采样点分布比较均匀。然后,在第②组和第③组的灰色区域中采样点分??布比较密集。以LCSS算法为例,距离接近的匹配点为相似点,第②组轨迹中相??似点在整体中占比高于第①组,结果是第②组轨迹的相似程度高于第①组轨迹;??而第③组中相似点在整体中占比低于第①组,结果是第③组轨迹的相似程度低于??第①组轨迹,其实三组轨迹都相同,只是采样点的分布情况不同。于是,可以发??现采样点分布不均会对相似性度量产生影响。所以,本章节将讨论一种针对采样??点非均匀分布的时空轨迹相似性查询算法。该查询算法的研究主要包含相似性度??量方法和查询算法两部分内容,前者决定查询效果,后者决定查询效率。相似性??度量方法是核心
【参考文献】:
期刊论文
[1]轨迹数据的连续距离查询技术[J]. 黄火荣,许建秋,秦小麟. 小型微型计算机系统. 2017(11)
[2]轨迹大数据:数据处理关键技术研究综述[J]. 高强,张凤荔,王瑞锦,周帆. 软件学报. 2017(04)
[3]基于语义轨迹停留点的位置服务匹配与应用研究[J]. 齐凌艳,陈荣国,温馨. 地球信息科学学报. 2014(05)
[4]面向大数据的时空数据挖掘综述[J]. 吉根林,赵斌. 南京师大学报(自然科学版). 2014(01)
本文编号:3627002
【文章来源】:南京师范大学江苏省211工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
图2-1轨迹中的噪声数据M??(1)中值或均值滤波??
噪声点很容易发现。然后基于噪声点再次探测距离阈值之内的邻近轨迹点是否为??异常点。虽然该方法能够处理初始误差问题和数据稀疏问题,但是速度阈值和距??阈值的设置仍然基于启发式算法。??2.停留点检测??轨迹中各个轨迹点的重要程度通常是不相同的。有些轨迹点描述了人们停留??的位置,例如商场、景区和汽车加油的加油站。这类点被称为“停留点”。停留??点主要分为两类,一类是用户在一段时间内停留在一个位置上,保持静止,如图??2-2⑻中的“StayPoint?1”所示。这类情况非常稀少,由于GPS等定位设备的精??确性有限,同一个定位设备在同一个位置的不同时刻往往会有不同的位置信息。??二类停留点在轨迹中较为常见,通常会在一个区域内部移动或围绕某个区域移??动,如图2-2(a)中的“StayP〇int2”所示,图2-2(b)和(c)也属于第二类停留点。??以通过计算连续轨迹点的空间距离和时间间隔进行判断,具体方法可在文献??[51]中查找。找出停留点之后,可以将轨迹转化为带有时间标记的停留点序列,??通过分析停留的信息,可用于各种应用,例如旅行路线推荐、目标地点预测、出??车推荐和估计汽油消费等。此外,在一些其他应用中则需要将停留点去除,例??如计算路径行驶时间和行驶方向的智能推荐。??in1ark
在城市路口处车速放缓,因而轨迹采样点较密:在高速路段,由于车速较快,因??而采样点较疏。采样点的密度不均会影响轨迹相似性度量(Euclid_,LCSS[24'M],??DTW[63],EDR[气ERP[66^)的结果。如图3-1所示,有三组相同的轨迹,第①??组的轨迹采样点分布比较均匀。然后,在第②组和第③组的灰色区域中采样点分??布比较密集。以LCSS算法为例,距离接近的匹配点为相似点,第②组轨迹中相??似点在整体中占比高于第①组,结果是第②组轨迹的相似程度高于第①组轨迹;??而第③组中相似点在整体中占比低于第①组,结果是第③组轨迹的相似程度低于??第①组轨迹,其实三组轨迹都相同,只是采样点的分布情况不同。于是,可以发??现采样点分布不均会对相似性度量产生影响。所以,本章节将讨论一种针对采样??点非均匀分布的时空轨迹相似性查询算法。该查询算法的研究主要包含相似性度??量方法和查询算法两部分内容,前者决定查询效果,后者决定查询效率。相似性??度量方法是核心
【参考文献】:
期刊论文
[1]轨迹数据的连续距离查询技术[J]. 黄火荣,许建秋,秦小麟. 小型微型计算机系统. 2017(11)
[2]轨迹大数据:数据处理关键技术研究综述[J]. 高强,张凤荔,王瑞锦,周帆. 软件学报. 2017(04)
[3]基于语义轨迹停留点的位置服务匹配与应用研究[J]. 齐凌艳,陈荣国,温馨. 地球信息科学学报. 2014(05)
[4]面向大数据的时空数据挖掘综述[J]. 吉根林,赵斌. 南京师大学报(自然科学版). 2014(01)
本文编号:3627002
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3627002.html