集成地理探测器与随机森林模型的城市人口分布格网模拟
发布时间:2021-08-27 19:13
精细尺度的城市人口分布信息是城市资源配置和综合管理的重要依据。本文以广州市越秀区、荔湾区、天河区、海珠区、白云区及黄埔区作为研究区域,基于人口统计、夜间灯光、兴趣点及土地利用等多源数据,利用地理探测器识别人口分布的影响因子,运用随机森林模型开展人口分布空间格网模拟研究。研究结果表明,与传统的相关分析相比,地理探测器能够更为准确地识别人口空间分布的重要影响因子。基于随机森林模型的人口分布格网模拟结果与街道(镇)实际人口的相关系数为0.774,平均相对误差约为30%。相比基于线性回归模型的模拟结果,随机森林模型的精度有明显提高。
【文章来源】:测绘通报. 2020,(01)北大核心CSCD
【文章页数】:6 页
【部分图文】:
基于线性回归模型的人口分布格网模拟结果
随机森林模型构建过程中需要确定2个重要参数,包括子树最大深度(max_depth)和子树数量(n_estimators)。首先,在子树数量较大的前提下(n_estimators=500),测试子树深度不同取值时随机森林模型的泛化性能。由图2可知,随着子树深度的增加,模型泛化性能逐渐增强,当子树深度等于6时,模型泛化性能达到最佳。其次,测试当子树深度为6的时候,子树数量与模型泛化性能的关系。由图3可知,随着子树数量的增加,模型泛化性能波动较大;当子树数量等于320时,模型泛化性能达到最优;随后,当子树数量大于600之后模型泛化性能较为稳定,且模型效果较好。综上所述,将子树最大深度设置为6,子树数量设置为600,搭建随机森林模型。3.3 模型结果及精度评价
模型泛化性能与子树数量之间的关系
【参考文献】:
期刊论文
[1]多源信息多尺度视角的南京市街道级人口模拟研究[J]. 许玲丽,颜梅春. 测绘通报. 2019(02)
[2]基于空间句法和LBS大数据的合肥市人口分布空间格局研究[J]. 张晓瑞,华茜,程志刚. 地理科学. 2018(11)
[3]基于多源数据的北京市朝阳区人口时空格局评估与预测[J]. 林文棋,陈会宴,谢盼,李颖,陈清凝,李栋. 地球信息科学学报. 2018(10)
[4]基于改进粒子滤波的室内自适应定位算法[J]. 胡东海,邵元,陈莹,夏士雄. 计算机工程与应用. 2019(09)
[5]联合区域叠加滤波法与小波变换去除GPS站坐标时间序列噪声[J]. 马俊,周晓慧,朱兆涵. 测绘通报. 2017(12)
[6]基于多源数据人口分布空间化研究——以河北省张家口市为例[J]. 黄安,许月卿,孙丕苓,刘超,郑伟然. 资源科学. 2017(11)
[7]基于随机森林模型的珠江三角洲30 m格网人口空间化[J]. 谭敏,刘凯,柳林,朱远辉,王大山. 地理科学进展. 2017(10)
[8]基于夜间灯光数据和空间回归模型的城市常住人口格网化方法研究[J]. 李翔,陈振杰,吴洁璇,汪文祥,曲乐安,周琛,韩肖锋. 地球信息科学学报. 2017(10)
[9]基于智能手机的室内定位技术的发展现状和挑战[J]. 陈锐志,陈亮. 测绘学报. 2017(10)
[10]和声搜索算法优化神经网络的无线网络室内定位[J]. 付思源,王华东. 南京理工大学学报. 2017(04)
硕士论文
[1]人口数据空间化格网尺度适宜性研究[D]. 徐凤娇.延边大学 2017
[2]城市人口数据空间化研究[D]. 毛莹莹.福建师范大学 2016
[3]长三角人口数据格网化及其人口空间分布特征分析[D]. 潘顺.上海师范大学 2016
[4]基于格网的人口空间分布特征分析[D]. 颜清梅.四川师范大学 2013
[5]基于多源数据的太湖流域人口空间化研究[D]. 刘焕金.南京农业大学 2012
本文编号:3366933
【文章来源】:测绘通报. 2020,(01)北大核心CSCD
【文章页数】:6 页
【部分图文】:
基于线性回归模型的人口分布格网模拟结果
随机森林模型构建过程中需要确定2个重要参数,包括子树最大深度(max_depth)和子树数量(n_estimators)。首先,在子树数量较大的前提下(n_estimators=500),测试子树深度不同取值时随机森林模型的泛化性能。由图2可知,随着子树深度的增加,模型泛化性能逐渐增强,当子树深度等于6时,模型泛化性能达到最佳。其次,测试当子树深度为6的时候,子树数量与模型泛化性能的关系。由图3可知,随着子树数量的增加,模型泛化性能波动较大;当子树数量等于320时,模型泛化性能达到最优;随后,当子树数量大于600之后模型泛化性能较为稳定,且模型效果较好。综上所述,将子树最大深度设置为6,子树数量设置为600,搭建随机森林模型。3.3 模型结果及精度评价
模型泛化性能与子树数量之间的关系
【参考文献】:
期刊论文
[1]多源信息多尺度视角的南京市街道级人口模拟研究[J]. 许玲丽,颜梅春. 测绘通报. 2019(02)
[2]基于空间句法和LBS大数据的合肥市人口分布空间格局研究[J]. 张晓瑞,华茜,程志刚. 地理科学. 2018(11)
[3]基于多源数据的北京市朝阳区人口时空格局评估与预测[J]. 林文棋,陈会宴,谢盼,李颖,陈清凝,李栋. 地球信息科学学报. 2018(10)
[4]基于改进粒子滤波的室内自适应定位算法[J]. 胡东海,邵元,陈莹,夏士雄. 计算机工程与应用. 2019(09)
[5]联合区域叠加滤波法与小波变换去除GPS站坐标时间序列噪声[J]. 马俊,周晓慧,朱兆涵. 测绘通报. 2017(12)
[6]基于多源数据人口分布空间化研究——以河北省张家口市为例[J]. 黄安,许月卿,孙丕苓,刘超,郑伟然. 资源科学. 2017(11)
[7]基于随机森林模型的珠江三角洲30 m格网人口空间化[J]. 谭敏,刘凯,柳林,朱远辉,王大山. 地理科学进展. 2017(10)
[8]基于夜间灯光数据和空间回归模型的城市常住人口格网化方法研究[J]. 李翔,陈振杰,吴洁璇,汪文祥,曲乐安,周琛,韩肖锋. 地球信息科学学报. 2017(10)
[9]基于智能手机的室内定位技术的发展现状和挑战[J]. 陈锐志,陈亮. 测绘学报. 2017(10)
[10]和声搜索算法优化神经网络的无线网络室内定位[J]. 付思源,王华东. 南京理工大学学报. 2017(04)
硕士论文
[1]人口数据空间化格网尺度适宜性研究[D]. 徐凤娇.延边大学 2017
[2]城市人口数据空间化研究[D]. 毛莹莹.福建师范大学 2016
[3]长三角人口数据格网化及其人口空间分布特征分析[D]. 潘顺.上海师范大学 2016
[4]基于格网的人口空间分布特征分析[D]. 颜清梅.四川师范大学 2013
[5]基于多源数据的太湖流域人口空间化研究[D]. 刘焕金.南京农业大学 2012
本文编号:3366933
本文链接:https://www.wllwen.com/shekelunwen/renkou/3366933.html
最近更新
教材专著