多源公众出行大数据综合可视化分析
发布时间:2020-05-30 22:02
【摘要】:随着大数据时代的来临,使人们对数据的认知也发生了颠覆,不再认为数据是静止的、历史的,而将其看作了动态的、鲜活的。公众出行是城市交通行为的主要组成部分,每天由公众出行而产生的数据体量已非常巨大,然而由于公众出行方式的多样,导致其大数据具有异源异构性,但其中包含的时空信息又是将其联系在一起的优质纽带。基于公众出行大数据中的时空信息,以地图为载体,进行空间可视化可以高效地描绘公众出行的时空画像。而Web GIS以其独特的灵活性成为了空间可视化的重要载体。本文以北京市公交车IC刷卡数据、地铁刷卡数据、出租车轨迹数据等作为数据基础,以数据中蕴含的时空信息作为纽带,建立起了多源数据之间的关联,并构建了公众出行客流模型、乘客出行链模型以及车辆运行轨迹模型,从而将公众出行客流以及乘客的行为模式进行可视化分析。本文研究内容和方法为:(1)搭建Hadoop集群。利用其分布式文件系统HDFS实现对大体量数据的存储工作,并且在MapReduce的并行式运算架构下实现对海量数据的高效查询与处理,从而建立起了可视化研究的后台支撑。(2)数据降噪与统计。通过编写基于MapReduce的滤波器实现对研究数据的降噪与统计。(3)数据的关联与建模。公众出行数据所携带的时空属性是建立多源数据间关联的重要纽带,通过各类数据间的空间关联与时序关系,实现多源数据的关联与融合,并根据时间与空间上的临近,建立各类出行方式的总客流分布模型;根据乘客IC卡卡号的关联,并进行换乘分析得到乘客的出行链;通过公交车线路与路网的匹配,得到公交线的运行路线,并根据相邻两站间乘客刷卡的时间差,得到公交车与该路段的运行速度,同理,也计算出出租车相邻轨迹点之间的运行速度,从而建立起了车辆运行轨迹模型。(4)大数据的可视化。根据建立的模型对数据进行检索之后,将得到的客流时空分布、乘客出行OD矩阵、乘客出行链以及车辆的运行轨迹,并将数据的分析结果通过动态专题地图以及非地理图表相结合的方式进行可视化渲染,并分析其中蕴含的公众出行规律。(5)多源数据的联动分析。本文在可视化的基础上,以地铁客流为核心,与公交车刷卡数据及出租车轨迹数据进行联动分析,验证客流量较多的地铁站点与周边公交站点客流量及出租车卸客点密度之间的正相关关系。
【图文】:
1.2.2 交通大数据研究现状在大数据时代,交通领域也同样步入了交通大数据纪元。交通系统是一个城市乃至国家的循环系统,交通技术的快速进步也是推动城市与国家发展的重要推动力。交通行为是人地交互的过程,其中自然会产生具备时空特征的数据,而每天中国居民出行产生的数据量是及其巨大的,这其中蕴藏着相当可观的知识财富[17]。目前学术界对于交通大数据的研究主要集中在城市交通大数据中,其中针对公交车与地铁的研究较多,因为城市的公共交通周期性特征较为明显,且公交车与地铁的运行路线相对固定,数据采集体系较为成熟,研究城市交通大数据对构建智慧城市有着重要意义。在国内外的研究中,对于城市公共交通大数据的分析研究主要是从客流分布、乘客行为模式挖掘等方面开展的[18]。客流量与其空间分布永远是交通领域各项研究的基本问题,而在基于城市公众交通大数据的分析中,,通常是基于公交车或是城市轨道交通的数据对其客流量和空间分布的研究,也有一些学者针对出租车轨迹数据开展研究工作,其中公交大数据主要分为乘客图 1-1 大数据技术软件栈Fig.1-1 Big Data Technology Software Stack
筛选、排序等工作。数据的审核一般认为这是一个数据预处理的准备过程的数据材料以及研究内容的需要,对一些存在错误的“脏数据”之外,还数据,该过程通常是通过编程实现的[3基于某个或某些指标进行排序,以便主要是将 2016 年 9 月北京市公交车在错误、缺失、遗漏的数据以及冗余程思想,编写数据滤波器,并在 Hado中的干扰项。传统的数据分析,传统的数据通常结现数据的存储与管理,依托于强结构化,以列为目标快速、准确地处理数据。规整的数据结构和巨大的体量,对于须依托于大数据处理技术执行数据挖
【学位授予单位】:北京建筑大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:P208;U12-39
【图文】:
1.2.2 交通大数据研究现状在大数据时代,交通领域也同样步入了交通大数据纪元。交通系统是一个城市乃至国家的循环系统,交通技术的快速进步也是推动城市与国家发展的重要推动力。交通行为是人地交互的过程,其中自然会产生具备时空特征的数据,而每天中国居民出行产生的数据量是及其巨大的,这其中蕴藏着相当可观的知识财富[17]。目前学术界对于交通大数据的研究主要集中在城市交通大数据中,其中针对公交车与地铁的研究较多,因为城市的公共交通周期性特征较为明显,且公交车与地铁的运行路线相对固定,数据采集体系较为成熟,研究城市交通大数据对构建智慧城市有着重要意义。在国内外的研究中,对于城市公共交通大数据的分析研究主要是从客流分布、乘客行为模式挖掘等方面开展的[18]。客流量与其空间分布永远是交通领域各项研究的基本问题,而在基于城市公众交通大数据的分析中,,通常是基于公交车或是城市轨道交通的数据对其客流量和空间分布的研究,也有一些学者针对出租车轨迹数据开展研究工作,其中公交大数据主要分为乘客图 1-1 大数据技术软件栈Fig.1-1 Big Data Technology Software Stack
筛选、排序等工作。数据的审核一般认为这是一个数据预处理的准备过程的数据材料以及研究内容的需要,对一些存在错误的“脏数据”之外,还数据,该过程通常是通过编程实现的[3基于某个或某些指标进行排序,以便主要是将 2016 年 9 月北京市公交车在错误、缺失、遗漏的数据以及冗余程思想,编写数据滤波器,并在 Hado中的干扰项。传统的数据分析,传统的数据通常结现数据的存储与管理,依托于强结构化,以列为目标快速、准确地处理数据。规整的数据结构和巨大的体量,对于须依托于大数据处理技术执行数据挖
【学位授予单位】:北京建筑大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:P208;U12-39
【相似文献】
相关期刊论文 前10条
1 于庆;刘淑静;付锦凤;高峗;单科;黄鹏飞;;基于WebGIS的海水淡化工程空间信息可视化应用研究[J];计算机与现代化;2013年03期
2 鲍R
本文编号:2688790
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/2688790.html