当前位置:主页 > 经济论文 > 国际贸易论文 >

基于数据挖掘的共享单车平衡预测研究 ——以太原市摩拜单车为例

发布时间:2021-06-25 02:27
  共享单车历经两年多的飞速发展,在带给市民便捷服务的同时暴露出了很多运营问题:单车乱停乱放、某些区域某些时刻一车难求、共享单车“百年坟场”等等。针对现有问题,从源头上控制运营,高效合理的单车投放水平能有效降低运营成本、减少新车的无序投放、单车分布不均衡等问题。共享单车各区域平衡预测问题包含2个部分:时间平衡和地理平衡。本文以太原市摩拜单车为例主要根据异常检测和聚类分析,研究发现太原市摩拜单车投放问题,并作预测建模。使用Python网络爬虫获取太原市区的摩拜单车地理位置信息数据,并对数据可视化分析,结合机器学习方法预测太原市摩拜单车区域平衡,为企业的精细化运营、共享单车的投放做好基础。本文研究内容如下:(1)使用Python网络爬虫获取摩拜单车数据集,并结合Python语言中的strip、split函数对数据集提取,存储在MySQL数据库中,结合MySQL数据库特性对数据集去重。(2)结合高德地图API对摩拜单车数据进行可视化操作,分析太原市摩拜单车区域分布热力图、随着时间变化的使用率以及使用量、骑行车辆距离分布。(3)使用数据挖掘中的聚类算法对太原市摩拜单车区域划分。结合摩拜单车区域与附... 

【文章来源】:中北大学山西省

【文章页数】:89 页

【学位级别】:硕士

【部分图文】:

基于数据挖掘的共享单车平衡预测研究 ——以太原市摩拜单车为例


高德地图开放平台认证前调用量

实名,开放平台,地图,经纬度


中北大学学位论文28图3.7 高德地图开放平台实名认证后调用量3.3.4 爬虫过程界定摩拜单车爬取范围,以经纬度逐步移动 0.001步长,实际距离为经纬度以 100米为方格计算,爬取摩拜单车经纬度数据。本文爬取太原市范围为经纬度[112.397233,38.042581]至经纬度[112.69159,37.728167],划分太原市为方格 100*100的网状型,获取每个方格点附近单车位置数据。设置爬虫范围 确认所需字段 创建表爬虫调用mobike API图3.8 爬虫流程图图 3.9 表示是爬虫程序运行后得到的数据,数据来源于太原市 2018 年 6 月 21 日到2018 年 8 月 27 日的摩拜单车骑行数据,包含太原市 6 个行政区,数据量总共 158 个表。

数据,数据预处理,数据挖掘,方格


中北大学学位论文29图3.9 爬虫数据3.4 MySQL数据整理数据预处理是数据挖掘非常重要的一部分。数据挖掘有两个方向,一个是不断改进算法;另一个不断改进数据质量。往往数据预处理是数据挖掘中最耗精力的部分。如上一小节,本文在爬取的太原市区范围内,以 100 * 100划分太原市为众多方格,爬取每个方格点附近单车数量,不可避免的同一个单车位置可能被多个方格点附近爬取。爬虫爬取初始源数据特征如下:①大量的重复项,加大程序的无效运行时间;②储存格式非程序能有效识别,在程序读取中需要进行格式统一化处理;③数据中含有众多异常值,需要剔除,否则影响结果输出;数据预处理已成为实施数据分析系统的关键部分


本文编号:3248304

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3248304.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8234d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com