基于机器学习方法的打车需求量预测研究
发布时间:2020-05-12 18:55
【摘要】:随着国家经济的迅猛发展,城市化进程的不断推进,城市道路交通给居民的日常生活带来了许多便利,但与此同时,人口的持续增长、车辆的日益增多,以及随之而来的居民日常交通出行需求大幅度增长,使得交通拥堵现象越来越频繁。智能交通系统是解决城市道路交通问题较为有效的途径,交通预测则是智能交通系统研究的重要内容。在城市公共交通运输系统中,出租车和网约车是其中的重要组成部分,但由于乘客的出行需求具有较大的波动性与随机性,出租车通过巡游的方式来寻找乘客具有较大的盲目性,同时网约车使用者的不断增加导致出现在某些时段、某些区域网约车供不应求,在另外的一些区域却运力过剩的现象。通过供需预测进行运力调度是解决乘客出行需求与车辆服务之间供需矛盾最为有效的途径。供需预测属于短时交通流预测领域,通过预测在某一时段、某一区域的乘客打车需求,指向性地把过剩的运力向周围特定区域进行调度,从而有效解决供需矛盾。本文通过查阅大量相关文献,从打车需求量预测和短时交通流预测两个方面进行国内外相关文献的综述,对打车需求量的预测展开研究。首先,建立基于极端梯度提升的打车需求量预测模型,从理论推导上分析了极端梯度提升算法相比较于传统的梯度提升算法的优势,通过对样本数据进行预处理,对打车需求量进行分析,构造模型特征,并通过实验对比验证了基于极端梯度提升的预测模型在预测打车需求量方面的有效性以及较其它预测模型更具优越性。其次,建立单变量线性回归模型提取打车需求量的月趋势,建立样条曲线模型提取打车需求量的日趋势,对基于极端梯度提升的打车需求量预测模型的特征进行优化,新增月趋势特征和日趋势特征,并通过实验验证了新增特征对提升模型预测精度的有效性。最后,基于本文所做的研究进行打车需求量预测系统的设计与实现,系统的功能由实时需求量、历史需求量和系统管理三大模块组成,而系统的实现则验证了本文所做研究的有效性与实用性。
【图文】:
图 3-2 数据地理位置范围基本属性运营过程中,出行软件以固定的时间间隔 2s 将车辆司机唯一标识码、时间戳、经度和纬度等信息上传至服务器对数据进行处理至数据库中。其中,司机 ID 字段为车辆司机唯一标识码,用于;订单 ID 字段为所属订单唯一标识码,用于关联相应的订单数数据采集的时间,单位为秒,以 unix 时间戳表示;经度字段为车,采用 GCJ-02 坐标系表示;纬度字段为车辆的实时位置纬度坐标示。轨迹数据集的格式如表 3-1 所示。表 3-1 轨迹数据集格式机 ID 订单 ID 时间戳 经度 8561b796ef8e2 39a096b71376b82f357 1477969147 104.07513
图 3-3 基础数据中存在重复数据(2) 网格划分基于网格的交通区域法是指将城市的交通系统按照合理的、均匀的空间尺度划分成多个小单元网格结构。然后将研究数据和网格进行匹配,从而形成不同密度的网格,最后根据不同数据密度的网格进行研究。该方法有利于解决大城市交通数据量大的问题。文献[10]在对乘客出行进行研究时,将杭州市市区进行网格划分,然后将出租车的出行数据与网格进行匹配,通过统计出每一个网格里乘客的上车次数和下车次数,将上下车比较频繁的网格作为出行需求热点。本文将数据集中所覆盖的成都市区域进行网格划分,,总共划分为 169 个子网格,第i 个网格记为 ( , , , ),其中 , , , 分别表示网格内点的最大经度,最小经度,最大纬度,最小纬度,即网格的边界线范围。如图 3-4 所示,第 1 个网格为 ( , , , ),第 2 个
【学位授予单位】:广州大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:U491;TP181
【图文】:
图 3-2 数据地理位置范围基本属性运营过程中,出行软件以固定的时间间隔 2s 将车辆司机唯一标识码、时间戳、经度和纬度等信息上传至服务器对数据进行处理至数据库中。其中,司机 ID 字段为车辆司机唯一标识码,用于;订单 ID 字段为所属订单唯一标识码,用于关联相应的订单数数据采集的时间,单位为秒,以 unix 时间戳表示;经度字段为车,采用 GCJ-02 坐标系表示;纬度字段为车辆的实时位置纬度坐标示。轨迹数据集的格式如表 3-1 所示。表 3-1 轨迹数据集格式机 ID 订单 ID 时间戳 经度 8561b796ef8e2 39a096b71376b82f357 1477969147 104.07513
图 3-3 基础数据中存在重复数据(2) 网格划分基于网格的交通区域法是指将城市的交通系统按照合理的、均匀的空间尺度划分成多个小单元网格结构。然后将研究数据和网格进行匹配,从而形成不同密度的网格,最后根据不同数据密度的网格进行研究。该方法有利于解决大城市交通数据量大的问题。文献[10]在对乘客出行进行研究时,将杭州市市区进行网格划分,然后将出租车的出行数据与网格进行匹配,通过统计出每一个网格里乘客的上车次数和下车次数,将上下车比较频繁的网格作为出行需求热点。本文将数据集中所覆盖的成都市区域进行网格划分,,总共划分为 169 个子网格,第i 个网格记为 ( , , , ),其中 , , , 分别表示网格内点的最大经度,最小经度,最大纬度,最小纬度,即网格的边界线范围。如图 3-4 所示,第 1 个网格为 ( , , , ),第 2 个
【学位授予单位】:广州大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:U491;TP181
【参考文献】
相关期刊论文 前10条
1 马剑;李文勇;梁满朝;;基于卡尔曼滤波的交通突发事件影响范围预测研究[J];长沙大学学报;2012年05期
2 宋驰;沈国江;;短时交通流预测模型综述[J];自动化博览;2012年06期
3 刘海红;周春梅;;短时交通流预测方法综述[J];芜湖职业技术学院学报;2011年04期
4 张涛;陈先;谢美萍;张sソ
本文编号:2660683
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/2660683.html