分区策略与机器学习的人口分布精细化模拟
发布时间:2022-02-15 14:34
针对人口普查统计中获取精细尺度的人口分布信息的问题,该文以广州市中心六区为例,利用夜间灯光、兴趣点及土地利用等多源地理信息数据,基于分区建模思想,运用机器学习算法开展了人口分布格网模拟研究。结果表明,基于分区策略和机器学习算法的人口分布模拟结果与实际人口的相关系数为0.834,拟合优度R2为0.695。与基于不分区的人口分布格网模型相比,误差下降明显,模拟精度更高,结果与研究区实际情况更为吻合。
【文章来源】:测绘科学. 2020,45(09)北大核心CSCD
【文章页数】:9 页
【部分图文】:
基于人口集聚度的分区图
针对人口密集地区,基于线性回归模型和随机森林模型,分别实现人口密集地区150 m格网人口分布模拟,模拟结果见图2。为了更好地辨析模型的优劣,利用GIS分区统计工具,以街道名称作为统计字段,将模拟结果进行统计;然后,基于街道尺度,从相关系数R、拟合优度R2和平均相对误差3个方面,将两个模型的模拟结果与实际统计人口进行精度比较。由表2可知,随机森林模型模拟结果与实际统计人口的相关性较为显著,拟合优度较佳,且平均相对误差为25.38%,较线性回归模型的模拟误差小。因此,在人口密集地区,随机森林模型的模拟精度要优于线性回归模型。表2 密集区模型精度对比Tab.2 Model Accuracy Comparison in Densely Populated Area 模型 相关系数R 拟合优度R2 平均相对误差/(%) 线性回归 0.586 0.343 29.28 随机森林 0.647 0.412 25.38
针对非人口密集地区,利用上文构建好的线性回归模型和随机森林模型分别实现非人口密集地区150 m格网人口模拟,模拟结果见图3。为了选取最优模拟结果,利用GIS分区统计工具,以街道名称作为统计字段,将模拟结果进行分街道汇总;然后,基于街道尺度,从相关系数R、拟合优度R2和绝对平均误差3个方面,将两个模型的模拟结果与实际统计人口进行比较,结果如表3所示。一方面,线性回归模型的模拟结果与实际统计人口的相关性更为显著、拟合结果更佳;另一方面,从绝对平均误差来看,线性回归模型的模拟结果绝对平均误差要较随机森林模型的模拟结果小。因此,在非人口密集地区,线性回归模型的模拟效果较优。表3 非密集区模型精度对比Tab.3 Model Comparison Results in Non-densely Populated Area 模型 相关系数R 拟合优度R2 绝对平均误差/% 线性回归 0.92 0.847 13.09 随机森林 0.86 0.738 16.09
【参考文献】:
期刊论文
[1]多源信息多尺度视角的南京市街道级人口模拟研究[J]. 许玲丽,颜梅春. 测绘通报. 2019(02)
[2]基于空间句法和LBS大数据的合肥市人口分布空间格局研究[J]. 张晓瑞,华茜,程志刚. 地理科学. 2018(11)
[3]基于多源数据的北京市朝阳区人口时空格局评估与预测[J]. 林文棋,陈会宴,谢盼,李颖,陈清凝,李栋. 地球信息科学学报. 2018(10)
[4]基于POI数据的人口分布格网化方法研究[J]. 淳锦,张新长,黄健锋,张鹏程. 地理与地理信息科学. 2018(04)
[5]基于多源数据人口分布空间化研究——以河北省张家口市为例[J]. 黄安,许月卿,孙丕苓,刘超,郑伟然. 资源科学. 2017(11)
[6]基于随机森林模型的珠江三角洲30 m格网人口空间化[J]. 谭敏,刘凯,柳林,朱远辉,王大山. 地理科学进展. 2017(10)
[7]基于夜间灯光数据和空间回归模型的城市常住人口格网化方法研究[J]. 李翔,陈振杰,吴洁璇,汪文祥,曲乐安,周琛,韩肖锋. 地球信息科学学报. 2017(10)
[8]基于DMSP/OLS夜间灯光数据的天山北坡城市群人口分布空间模拟[J]. 高倩,阿里木江·卡斯木. 西北人口. 2017(03)
[9]2000~2010年南京都市区人口空间变动特征研究[J]. 曾文,张小林,向梨丽,王亚华. 地理科学. 2016(01)
[10]智能手机定位数据应用于城市研究的进展与展望[J]. 郭璨,甄峰,朱寿佳. 人文地理. 2014(06)
硕士论文
[1]城市人口数据空间化研究[D]. 毛莹莹.福建师范大学 2016
[2]长三角人口数据格网化及其人口空间分布特征分析[D]. 潘顺.上海师范大学 2016
[3]基于格网的人口空间分布特征分析[D]. 颜清梅.四川师范大学 2013
[4]基于多源数据的太湖流域人口空间化研究[D]. 刘焕金.南京农业大学 2012
本文编号:3626800
【文章来源】:测绘科学. 2020,45(09)北大核心CSCD
【文章页数】:9 页
【部分图文】:
基于人口集聚度的分区图
针对人口密集地区,基于线性回归模型和随机森林模型,分别实现人口密集地区150 m格网人口分布模拟,模拟结果见图2。为了更好地辨析模型的优劣,利用GIS分区统计工具,以街道名称作为统计字段,将模拟结果进行统计;然后,基于街道尺度,从相关系数R、拟合优度R2和平均相对误差3个方面,将两个模型的模拟结果与实际统计人口进行精度比较。由表2可知,随机森林模型模拟结果与实际统计人口的相关性较为显著,拟合优度较佳,且平均相对误差为25.38%,较线性回归模型的模拟误差小。因此,在人口密集地区,随机森林模型的模拟精度要优于线性回归模型。表2 密集区模型精度对比Tab.2 Model Accuracy Comparison in Densely Populated Area 模型 相关系数R 拟合优度R2 平均相对误差/(%) 线性回归 0.586 0.343 29.28 随机森林 0.647 0.412 25.38
针对非人口密集地区,利用上文构建好的线性回归模型和随机森林模型分别实现非人口密集地区150 m格网人口模拟,模拟结果见图3。为了选取最优模拟结果,利用GIS分区统计工具,以街道名称作为统计字段,将模拟结果进行分街道汇总;然后,基于街道尺度,从相关系数R、拟合优度R2和绝对平均误差3个方面,将两个模型的模拟结果与实际统计人口进行比较,结果如表3所示。一方面,线性回归模型的模拟结果与实际统计人口的相关性更为显著、拟合结果更佳;另一方面,从绝对平均误差来看,线性回归模型的模拟结果绝对平均误差要较随机森林模型的模拟结果小。因此,在非人口密集地区,线性回归模型的模拟效果较优。表3 非密集区模型精度对比Tab.3 Model Comparison Results in Non-densely Populated Area 模型 相关系数R 拟合优度R2 绝对平均误差/% 线性回归 0.92 0.847 13.09 随机森林 0.86 0.738 16.09
【参考文献】:
期刊论文
[1]多源信息多尺度视角的南京市街道级人口模拟研究[J]. 许玲丽,颜梅春. 测绘通报. 2019(02)
[2]基于空间句法和LBS大数据的合肥市人口分布空间格局研究[J]. 张晓瑞,华茜,程志刚. 地理科学. 2018(11)
[3]基于多源数据的北京市朝阳区人口时空格局评估与预测[J]. 林文棋,陈会宴,谢盼,李颖,陈清凝,李栋. 地球信息科学学报. 2018(10)
[4]基于POI数据的人口分布格网化方法研究[J]. 淳锦,张新长,黄健锋,张鹏程. 地理与地理信息科学. 2018(04)
[5]基于多源数据人口分布空间化研究——以河北省张家口市为例[J]. 黄安,许月卿,孙丕苓,刘超,郑伟然. 资源科学. 2017(11)
[6]基于随机森林模型的珠江三角洲30 m格网人口空间化[J]. 谭敏,刘凯,柳林,朱远辉,王大山. 地理科学进展. 2017(10)
[7]基于夜间灯光数据和空间回归模型的城市常住人口格网化方法研究[J]. 李翔,陈振杰,吴洁璇,汪文祥,曲乐安,周琛,韩肖锋. 地球信息科学学报. 2017(10)
[8]基于DMSP/OLS夜间灯光数据的天山北坡城市群人口分布空间模拟[J]. 高倩,阿里木江·卡斯木. 西北人口. 2017(03)
[9]2000~2010年南京都市区人口空间变动特征研究[J]. 曾文,张小林,向梨丽,王亚华. 地理科学. 2016(01)
[10]智能手机定位数据应用于城市研究的进展与展望[J]. 郭璨,甄峰,朱寿佳. 人文地理. 2014(06)
硕士论文
[1]城市人口数据空间化研究[D]. 毛莹莹.福建师范大学 2016
[2]长三角人口数据格网化及其人口空间分布特征分析[D]. 潘顺.上海师范大学 2016
[3]基于格网的人口空间分布特征分析[D]. 颜清梅.四川师范大学 2013
[4]基于多源数据的太湖流域人口空间化研究[D]. 刘焕金.南京农业大学 2012
本文编号:3626800
本文链接:https://www.wllwen.com/guanlilunwen/chengjian/3626800.html