基于定位数据的人口分布特征研究
发布时间:2020-07-14 19:27
【摘要】:智能手机、全球定位系统与移动互联网的发展共同促进了一项新型的服务——基于位置的服务。不同于传统的互联网服务,基于位置服务立足于智能手机的定位功能,提供与用户地理位置高度相关的信息服务。智能手机普及率持续升高,移动互联应用形式多样化,移动定位技术起到了基础的作用。移动定位技术不仅为用户的生活提供了便利,为移动应用提供了基础服务,并且其服务过程中产生的大量用户实时定位数据。大规模用户的位置信息,可以作为对城市运行状态的一种检测手段。由于智能手机的普及,大规模的定位数据是对人口空间分布的一种采样。利用Hadoop平台的大数据处理分析能力,对百度移动定位服务系统运行日志进行整合,获取定位密度影像数据。基于对定位数据的分析,结合与夜间灯光数据、微博签到数据的对比,揭示了人口的空间分布特征,并有以下的结论:1.用户定位数量在时间上呈现周期性的变化;2.人口的分布在空间上呈现幂律分布特征;3.定位数据能够很好的刻画人口的空间分布及其时间变化。基于人口空间分布特征,定位密度可以理解为人口分布的一种抽样调查,尝试以定位数据进行了人口密度制图。对定位密度数据的时空变化进行了分析,验证了定位密度数据包含有大量地理空间相关信息,以此为依据,进行两个方面的应用研究:1.人类的各种活动与城市空间密不可分,基于随机森林算法,训练了城市建成区的分类模型,进行了全国城市建成区制图。2.定位密度的时空变化与城市用地类型有很强的相关性,采用梯度迭代决策树算法,训练了城市用地类型分类模型,并验证模型的有效性。通过对人口时空分布特征的研究,以及对人口时空分布变化中隐藏的大量信息的挖掘,本文实践了以人为传感器的思想,验证了用户生成位置数据在地理研究中的巨大潜力。
【学位授予单位】:中国地质大学(北京)
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:C922;P208
【图文】:
中国地质大学(北京)硕士学位论文13图2-3 定位量数据由于用户群体分布,图2-3中台湾和南海诸岛并没有定位数据,中国版图无关。由图2-3中可以明显的看到黑河-腾冲线左右的对比,以及京津冀鲁豫区域、长三角、珠三角、山西、成都的高定位量分布。定位数据清晰的勾勒出了中国城市的分布,由于数据分布清晰,故并没有加特别注记。
睡眠时、工作时定位请求较少,休息时、出行时定位请求较多。定位量随时间变化,是人在不同时间进行不同类型活动的体现。图3-1 每小时定位量图3-1为2014年12月百度定位服务每小时为全国提供的定位请求数量,其中蓝色为工作日定位量,红色为周末定位量,绿色为12月31日定位量(由于元旦假期以及各地的跨年活动影响,当天虽然不是假期,但与正常工作日有明显不同,故以不同颜色显示,以示区分)。图3-1中显示定位数量在时间上的变化,有明显的特征:1) 定位量在所有的日期都服从一个整体的分布:定位量在凌晨四点左右达
较少的区域定位量变化浮动较大,故以哈尔滨、北京、成都为例 ,分别统计其定位量,研究时差对定位量的影响。图3-2 哈尔滨、北京、成都定位量对比北京(116.40, 39.91)、哈尔滨(126.63, 45.77)、成都(104.07, 30.66)三者之间经度相差10度左右,时差约为40分钟(经度相差15度时差为一小时)。如图3-2所示,从定位数量一些基本特征点的后移可以发现,时差(纬度差异)造成了定位量的波形的整体后移,如最明显的假期定位请求量与工作日定位请求量在凌晨5点左右的延时增长起点的后移。但是由于三个城市使用的都是北京时间,故定位量的变化趋势基本相同,定位量的推移时间并没有达到三个城市的时差(40分钟)的长度。不同城市定位数量的时间变化虽然有着相似的波形,代表着定位数量在各
本文编号:2755387
【学位授予单位】:中国地质大学(北京)
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:C922;P208
【图文】:
中国地质大学(北京)硕士学位论文13图2-3 定位量数据由于用户群体分布,图2-3中台湾和南海诸岛并没有定位数据,中国版图无关。由图2-3中可以明显的看到黑河-腾冲线左右的对比,以及京津冀鲁豫区域、长三角、珠三角、山西、成都的高定位量分布。定位数据清晰的勾勒出了中国城市的分布,由于数据分布清晰,故并没有加特别注记。
睡眠时、工作时定位请求较少,休息时、出行时定位请求较多。定位量随时间变化,是人在不同时间进行不同类型活动的体现。图3-1 每小时定位量图3-1为2014年12月百度定位服务每小时为全国提供的定位请求数量,其中蓝色为工作日定位量,红色为周末定位量,绿色为12月31日定位量(由于元旦假期以及各地的跨年活动影响,当天虽然不是假期,但与正常工作日有明显不同,故以不同颜色显示,以示区分)。图3-1中显示定位数量在时间上的变化,有明显的特征:1) 定位量在所有的日期都服从一个整体的分布:定位量在凌晨四点左右达
较少的区域定位量变化浮动较大,故以哈尔滨、北京、成都为例 ,分别统计其定位量,研究时差对定位量的影响。图3-2 哈尔滨、北京、成都定位量对比北京(116.40, 39.91)、哈尔滨(126.63, 45.77)、成都(104.07, 30.66)三者之间经度相差10度左右,时差约为40分钟(经度相差15度时差为一小时)。如图3-2所示,从定位数量一些基本特征点的后移可以发现,时差(纬度差异)造成了定位量的波形的整体后移,如最明显的假期定位请求量与工作日定位请求量在凌晨5点左右的延时增长起点的后移。但是由于三个城市使用的都是北京时间,故定位量的变化趋势基本相同,定位量的推移时间并没有达到三个城市的时差(40分钟)的长度。不同城市定位数量的时间变化虽然有着相似的波形,代表着定位数量在各
【参考文献】
相关期刊论文 前3条
1 杨元喜;;北斗卫星导航系统的进展、贡献与挑战[J];测绘学报;2010年01期
2 王鹤饶;郑新奇;袁涛;;DMSP/OLS数据应用研究综述[J];地理科学进展;2012年01期
3 王晶;朱珂;汪斌强;;基于信息数据分析的微博研究综述[J];计算机应用;2012年07期
本文编号:2755387
本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/2755387.html