当前位置:主页 > 经济论文 > 经济管理论文 >

基于出租车轨迹数据挖掘的推荐模型研究

发布时间:2017-05-23 07:32

  本文关键词:基于出租车轨迹数据挖掘的推荐模型研究,由笔耕文化传播整理发布。


【摘要】:随着出租车行业的快速发展,出租车弥补了公共交通和私人交通的不足之处,成为了人们日常出行中必不可少的交通工具之一,在交通出行中起到了扮演了重要的角色。目前,北京市的交通状况正在逐步恶化,一方面,“打车难”成为交通出行的普遍现象;与之相对应的,有些时间段,很多出租车因为在路上载不到乘客而空载,出现“空车跑”的现象。这些空载的情况不仅会提高出租车司机的运营成本、减少收入,而且会给现有的交通状况带来额外的负担,同时还会加重环境污染和能源浪费的问题。基于以上的原因,如何有效的改善出租车与乘客之间的供需关系,达到供需平衡成为一个亟待解决的问题。近些年来,为了安全考虑和调度方便,很多大城市如上海、深圳、北京等都在出租车上装备了GPS定位设备。这些GPS定位设备会以一定的频率向出租车管理中心发送车辆的状态信息,包括所在的经纬度、时间以及载客状态等。这些数据不断积累,生成了大量的出租车GPS轨迹数据。出租车GPS轨迹数据包括了两方面的内容,一方面是出租车乘客的出行信息,例如乘客什么时候上车、下车,出行的出发地和目的地等,可以用来研究居民的日常出行行为;另一方面,出租车的行驶路线包括了出租车司机的习惯和行为,例如在哪些地方能够找到乘客、怎样的行驶的路线最近、油耗最少、时间最短等等,可以用来研究城市道路的最短路径和交通拥堵情况。通过对以上两方面的研究,本文通过挖掘大量的出租车GPS轨迹数据,提出了针对打车乘客的乘客候车点推荐模型和针对出租车司机的乘客订单推荐模型。具体包括两方面的内容:一方面,通过对大量的GPS轨迹数据的挖掘,发现出租车司机的日常行为特点,为正在打车的乘客推荐步行可以到达的最有可能遇到空载的出租车的地点,这些地点在文中称为出租车停靠点,向乘客推荐候车点,有效的减少了乘客的等车时间,缓解出租车和乘客之间的供需矛盾;另一方面,通过改进CKNN算法,根据正在寻找乘客的出租车司机的地理位置和当前的时间,为司机寻找最适合的乘客候选集,并提出两个影响出租车司机选择乘客行为的指标:乘客目的地的热门程度和司机偏好相关度,利用BP神经网络算法构建乘客推荐模型进行乘客订单筛选,为出租车司机推荐最佳的乘客集,从而有助于减少出租车的空载时间,提高司机的收益,同时也能达到减少油耗,降低污染的目的。本文的主要贡献如下:本文从出租车的GPS轨迹数据出发,通过聚类算法挖掘那些利润较高的出租车司机,并研究他们在非乘客高峰时间停车等待乘客的行为特点,根据这些出租车停靠点的特征,提出一种可以准确的挖掘出租车停靠点的候选轨迹点的算法,通过对候选轨迹点的过滤和聚类,得到了真正的出租车停靠点,从而构建了基于出租车候车点的乘客推荐模型,在有乘客发出打车需求时,实时检索乘客附近的出租车停靠点,该停靠点即为乘客最佳的候车点。本文改进了原有的CKNN算法,提出一种近似的CKNN算法来实时检索出租车附近的候选乘客集,通过对出租车GPS轨迹数据的挖掘,提出两个影响出租车司机选择乘客行为的指标:乘客目的地的热门程度、与司机的偏好相关度,可以通过挖掘出租车的热点载客区域计算乘客目的地的热门程度,通过挖掘出租车的历史行驶轨迹来计算司机的偏好相关度,最后利用BP神经网络算法构建乘客推荐模型,利用模型判定候选乘客集中每个乘客的推荐程度,为出租车司机推荐最佳的候选乘客集。
【关键词】:出租车轨迹数据 DBCSAN聚类 出租车停靠点 热点区域司机偏好
【学位授予单位】:首都经济贸易大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F572;F224
【目录】:
  • 摘要5-7
  • ABSTRACT7-11
  • 1 绪论11-18
  • 1.1 引言11
  • 1.2 研究背景与意义11-12
  • 1.3 相关文献综述12-14
  • 1.4 论文的目标、主要内容、织结构及创新点14-18
  • 1.4.1 论文目标14-15
  • 1.4.2 论文主要内容15-16
  • 1.4.3 论文组织结构16-17
  • 1.4.4 论文主要创新点17-18
  • 2 出租车轨迹数据挖掘的基本理论和相关技术18-25
  • 2.1 出租车轨迹数据挖掘的基本理论18-21
  • 2.1.1 出租车轨迹数据基本概念18-19
  • 2.1.2 出租车轨迹数据的基本特征19
  • 2.1.3 出租车轨迹数据的来源和获取方法19-21
  • 2.1.3.1 浮动车采集技术19-20
  • 2.1.3.2 出租车轨迹数据的来源20-21
  • 2.2 轨迹数据挖掘的相关技术21-24
  • 2.2.1 轨迹数据挖掘方法21-22
  • 2.2.2 基于密度的聚类算法22-24
  • 2.2.2.1 DBSCAN算法22-23
  • 2.2.2.2 OPTICS算法23-24
  • 2.3 其他相关技术24-25
  • 2.3.1 GPS定位技术24
  • 2.3.2 手机移动定位技术24-25
  • 3 出租车轨迹数据预处理25-30
  • 3.1 轨迹数据预处理25-28
  • 3.1.1 数据冗余处理26
  • 3.1.2 数据缺失处理26-27
  • 3.1.3 数据漂移处理27-28
  • 3.2 地图匹配28-30
  • 4 基于出租车轨迹数据挖掘的乘客候车点推荐模型30-40
  • 4.1 乘客候车点30-31
  • 4.2 出租车停靠点挖掘31-36
  • 4.2.1 出租车停靠点搜索算法31-33
  • 4.2.2 出租车停靠点过滤33-35
  • 4.2.3 候选点群OPTICS方法聚类35-36
  • 4.3 乘客最佳候车点推荐36-37
  • 4.4 模型实证37-40
  • 4.4.1 出租车停靠点验证38-39
  • 4.4.2 实地测试39-40
  • 5 基于出租车轨迹数据挖掘的乘客推荐模型40-58
  • 5.1 研究动因40-41
  • 5.2 候选乘客集检索41-45
  • 5.2.1 出租车的近似连续k近邻检索(CkNN )41-44
  • 5.2.2 候选乘客集44-45
  • 5.3 出租车热点载客区域检测45-49
  • 5.3.1 数据处理46
  • 5.3.2 出租车载客时间段划分46-48
  • 5.3.3 按时段进行DBSCAN聚类48-49
  • 5.4 司机偏好挖掘49-51
  • 5.4.1 载客重点区域挖掘50-51
  • 5.4.2 司机偏好相关度51
  • 5.5 乘客推荐模型的建立51-53
  • 5.5.1 BP神经网络模型51-53
  • 5.5.2 乘客推荐模型53
  • 5.6 基于MatLab的乘客推荐模型仿真实验53-58
  • 6 总结及展望58-60
  • 6.1 现阶段工作总结58-59
  • 6.2 前景及展望59-60
  • 致谢60-61
  • 参考文献61-65
  • 在学期间发表的学术论文及研究成果65-66

【参考文献】

中国期刊全文数据库 前5条

1 程鹏飞;闫浩文;韩振辉;;一个求解多边形最小面积外接矩形的算法[J];工程图学学报;2008年01期

2 付鹏;;采用层次分析法确定技术标权重的实践[J];价值工程;2012年24期

3 Dao-Zheng Zhang;Daniel (Jian) Sun;Zhong-Ren Peng;;A Comprehensive Taxi Assessment Index Using Floating Car Data[J];Journal of Harbin Institute of Technology;2014年01期

4 贺桂和;;基于用户偏好挖掘的电子商务协同过滤推荐算法研究[J];情报科学;2013年12期

5 唐炉亮;常晓猛;李清泉;SHAW S L;;基于蚁群优化算法与出租车GPS数据的公众出行路径优化[J];中国公路学报;2011年02期

中国博士学位论文全文数据库 前2条

1 尹华罡;基于海量时空数据的路线挖掘与检索[D];中国科学技术大学;2012年

2 王冠男;基于GPS轨迹和照片轨迹的时空数据挖掘[D];中南大学;2013年

中国硕士学位论文全文数据库 前1条

1 温雅静;基于热点载客区域的出租车应急调度方案研究[D];北京交通大学;2014年


  本文关键词:基于出租车轨迹数据挖掘的推荐模型研究,,由笔耕文化传播整理发布。



本文编号:387244

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/387244.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3f222***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com