基于轨迹数据的出行目的地预测及隐私保护方法研究
发布时间:2020-10-02 06:40
对于城市计算中预测问题的研究,是指通过对已有的数据的分析,发现并解决城市中存在的问题,比如,越来越多的交通事故、交通拥堵、环境恶化、噪音污染、能源消耗等等,从而更好地规划城市。随着越来越多车载设备的普及,交通数据的采集变得更加容易,数据属性变得更加丰富,数据量变得更加庞大,所以,基于交通大数据的研究变得更具可行性。如今,基于位置服务越来越重要,出租车是用户出行的重要方式之一,本文利用真实的上海市出租车GPS轨迹对其出行目的地进行预测,完成对用户行程模式的挖掘,可以对基于位置服务的应用产生积极的影响。提出了一种基于不同时间段的目的地预测算法能够有效地解决传统方法所存在数据稀疏的问题,从实验结果分析可以看出,通过增加对时间因素的考量,该算法的预测结果具有更高的准确性和预测效率。同时,在基于位置服务中,对用户的真实位置信息进行有效保护是十分必要的,所以,本文不仅对目的地预测中的位置隐私保护进行了研究,还利用真实的长春市手机信令数据,在轨迹公布过程中,对用户轨迹数据进行了隐私保护研究,即对用户的轨迹数据进行匿名化处理,从而达到隐私保护的目的。由此看来,对于轨迹数据的深入研究对交通智能化有现实意义和重要价值。本文主要贡献:1.提出了时间因素对目的地预测的影响,即在子轨迹合成算法[1]的基础上增加了时间因素,先判断轨迹所处的时间段,之后对其进行目的地的预测,使得预测结果更加准确。2.分模态建模。根据不同时间段内的轨迹数量的不同可知,不同时间段内的马尔可夫模型是不同的,所以分别在不同时间段内建立马尔可夫模型,从而求出不同的状态转移概率矩阵,之后即可得到以时间为Y轴的三维状态转移概率矩阵,应用于预测算法的之后步骤。3.对手机信令轨迹数据进行隐私保护。提出基于地图网格化以及空间上的轨迹聚类算法,对用户的行程轨迹进行匿名化处理,从而达到隐私保护的目的。4.采用真实的出租车GPS轨迹数据与手机信令数据进行实验,实验结果证明了基于时间的目的地预测算法以及基于网格和轨迹聚类对轨迹数据进行隐私保护的算法是有效的。
【学位单位】:吉林大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:U495;TP309
【部分图文】:
将所研究区域划分为 20*20 的网格。其中图2.2 的高亮部分是本文所研究的地域范围,图 2.3 是将所研究范围进行网格化之后得到的结果:1 2 3 456 789 1011 1213 14 15 16 1 2 3 4
图 2.2 上海市地图 图 2.3 实验所用区域网格化2.3 马尔可夫模型马尔可夫模型(Markov Model)是一种统计模型,它是以俄罗斯数学家安德雷·安德耶维齐·马尔可夫(1856—1922)命名的。马尔可夫链(MarkovChain)[39,40],是指数学中具有马尔可夫性质的离散事件随机过程。该过程中,在已知的当前知识或信息被确定的情况下,过去(即当前以前的状态)对于预测将来(即当前以后的状态)是不相关的。在马尔可夫链的每一步,系统根据概率分布,可以从一个状态转换成其他状态,也可以保持当前状态。状态的改变叫做转移,在不同的状态之间进行转换的概率叫做转移概率。公式(2.1)中 的值代表在时间 n 的状态。如果 +1对于过去状态的条件概率分布仅与 相关,即: +1= 1= 1, 2= 2, , = = +1= = … (2.1)
第 3 章 基于 GPS 轨迹数据的目的地预测算法研究该参数的含义是预测的目的地与实际目的地的距离。行程完成度是对轨迹当置距离其起点位置的度量标准,即记录当前时刻,车辆行走的距离占其总行百分比,行程完成度越高代表车辆越接近目的地,本文实验所选的行程完成次为 30%、50%、70%。预测误差结果如下所示,可以得出的结论是随着行成度越高,预测误差越小。
本文编号:2832056
【学位单位】:吉林大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:U495;TP309
【部分图文】:
将所研究区域划分为 20*20 的网格。其中图2.2 的高亮部分是本文所研究的地域范围,图 2.3 是将所研究范围进行网格化之后得到的结果:1 2 3 456 789 1011 1213 14 15 16 1 2 3 4
图 2.2 上海市地图 图 2.3 实验所用区域网格化2.3 马尔可夫模型马尔可夫模型(Markov Model)是一种统计模型,它是以俄罗斯数学家安德雷·安德耶维齐·马尔可夫(1856—1922)命名的。马尔可夫链(MarkovChain)[39,40],是指数学中具有马尔可夫性质的离散事件随机过程。该过程中,在已知的当前知识或信息被确定的情况下,过去(即当前以前的状态)对于预测将来(即当前以后的状态)是不相关的。在马尔可夫链的每一步,系统根据概率分布,可以从一个状态转换成其他状态,也可以保持当前状态。状态的改变叫做转移,在不同的状态之间进行转换的概率叫做转移概率。公式(2.1)中 的值代表在时间 n 的状态。如果 +1对于过去状态的条件概率分布仅与 相关,即: +1= 1= 1, 2= 2, , = = +1= = … (2.1)
第 3 章 基于 GPS 轨迹数据的目的地预测算法研究该参数的含义是预测的目的地与实际目的地的距离。行程完成度是对轨迹当置距离其起点位置的度量标准,即记录当前时刻,车辆行走的距离占其总行百分比,行程完成度越高代表车辆越接近目的地,本文实验所选的行程完成次为 30%、50%、70%。预测误差结果如下所示,可以得出的结论是随着行成度越高,预测误差越小。
【参考文献】
相关期刊论文 前5条
1 张伟;王旭然;王珏;陈云芳;;基于k-邻域同构的动态社会网络隐私保护方法[J];南京邮电大学学报(自然科学版);2014年05期
2 武艳娜;赵泽茂;孙传林;;划分子匿名区域的k-匿名位置隐私保护方法[J];信息安全与技术;2014年10期
3 李建明;;智慧城市发展综述[J];中国电子科学研究院学报;2014年03期
4 胡腾波;叶建栲;;马尔科夫链模型在GIS数据预测中的应用[J];计算机系统应用;2008年08期
5 汪海波,张海臣,段雪丽;基于MATLAB的自组织竞争神经网络聚类研究[J];邢台职业技术学院学报;2005年01期
相关博士学位论文 前1条
1 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
相关硕士学位论文 前2条
1 周灵通;基于历史行车轨迹的目的地预测算法研究[D];华南理工大学;2015年
2 段明秀;层次聚类算法的研究及应用[D];中南大学;2009年
本文编号:2832056
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/2832056.html