当前位置:主页 > 经济论文 > 区域经济论文 >

基于探索性空间数据分析方法的北京市区域经济差异

发布时间:2016-08-08 19:15

  本文关键词:基于探索性空间数据分析方法的北京市区域经济差异,由笔耕文化传播整理发布。


第29卷第12期2010年12月

地理科学进展

Vol.29,No.12Dec.,2010

基于探索性空间数据分析方法的北京市

区域经济差异

马晓熠,裴韬

(中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京100101)

摘要:我国区域经济的不平衡发展是政府和社会普遍关注的问题。针对城乡之间的较大尺度上的空间差异研究已经受到普遍的关注,但对经济发展迅猛的特大城市(如北京、重庆、上海等)内部贫富差距加大的现象尚未引起足够的重视,而这种现象有可能成为经济可持续发展和社会稳定的严重隐患。因此,正确认识特大城市内部的经济差异及演变趋势,是实现区域协调发展的重要条件之一。本文采用探索性空间数据分析方法,以北京市18区/县的人均GDP作为评估标准,分析了北京市18区(县)在2001-2007年,即2008年奥运会筹备期间的经济发展的空间格局及其变化规律。分析结果表明北京市人均GDP的空间分布自2005年后开始有向负的空间自相关性发展的趋势,暗示北京各区县的经济发展局部分异正在逐渐拉大,并显示由过去的南低北高的经济发展差异格局逐步转变为中心高周边低的空间分布格局。

关键词:区域经济;探索性空间数据分析;空间自相关性;北京

1引言

不平衡的区域经济发展已是一种普遍存在的社会经济现象。近期,国家为解决国家尺度下的经济不均衡发展格局,先后提出了西部大开发、振兴东北、中部崛起等重大战略。然而对经济高速发展的特大城市内部的区域经济的协调发展并没引起充分关注,其内部日趋扩大的贫富差距将有可能对特大城市经济可持续发展和社会稳定造成隐患。准确揭示特大城市内部经济差异及演变趋势是制定区域经济发展政策和战略的重要基础。目前,研究区域经济差异方法已有很多,如反映区域绝对差异极差(绝对离差)、平均差、标准差(SD)等;反映区域相对差异的变差系数(CV)、基尼系数(Gini)、泰尔指数(Theilindex)、广义熵指数(GE)等[1-3]。然而,以往研究多是运用传统的数量统计模型,建立在区域之间相互独立,不存在任何空间关联的假设前提之下。而事实上,由区域发展的相关理论和实践表明,区域之间存在着扩散效应或集聚效应,即经济发展以向外扩散或集中为主导方向,从而缩小或扩大区域经济的空间差异[4],因此,在研究不同尺度的

区域差异问题时必须考虑空间的影响。

由于探索性空间数据分析(ExploratorySpatialDataAnalysis,ESDA)方法可利用属性数据的空间特性,在分析空间关系的基础上进行数值的相关分析进而突出空间相互作用,因而近年来已逐渐被国内外学者应用于区域经济差异的研究领域。1999年Rey等[5]应用ESDA对美国州域经济差异进行分析,结果证明了其各州人均收入在1929-1994年间存在显著的聚集分布。López-Bazo等[6]以及LeGallo等[7]利用人均GDP及其增长率对欧洲11国家138个区域的经济差异进行ESDA分析也得出了类似的结果。2006年Ertur等[8]扩大了研究区域,对东扩后欧盟27国258个区域经济差异进行ES-DA分析,结果证明在1992-2000年间人均GDP同样存在明显的聚集,且欧盟的东扩使经济贫富差异分布由过去的南北贫富差异转变为西北富裕,东部贫穷的差异现象。在我国,唐建军[9]以长江三角洲县域为研究单位,以人均GDP及其年平均增长率为检测指标,对长三角经济圈形成前后的经济现象进行了比较。仇方道等[10]利用ESDA与传统的统计相结合对淮海经济区经济差异的空间格局及演化

收稿日期:2010-02;修订日期:2010-07.

基金项目:科技部863课题(2006AA120106);中国科学院地理科学与资源研究所自主部署创新项目(200905004)。作者简介:马晓熠(1978-),女,助理研究员,主要研究方向为空间数据挖掘。E-mail:maxy@1reis.ac.cn通讯作者:裴韬,E-mail:peit@lreis.ac.cn

1556地理科学进展29卷1

进行了探索性研究。然而,目前我国在利用ESDA技术对特大城市内部经济发展差异上的研究还鲜有报道。针对上述研究空白,本文将ESDA技术与GIS技术相结合,以北京市为例对其18区/县的人均GDP在2001-2007年期间的空间格局进行分析,试图揭示北京市经济发展差异在2008年奥运会筹备期间(7年间)的时空演变,并实现对特大城市内部经济差异研究的初步探索。

关,即区域间的经济发展水平相互独立,在空间上随机分布。

对于Moran指数,可以用标准化统计量Z来检验n个区域是否存在空间自相关关系。Z的计算

I-E(I)

公式为:Z=(2)

式中:E(I)为Moran指数I的期望值,σ(I)为所有观测值的Moran指数IE(I)=-1/(n-1);

2探索性空间数据分析方法(ESDA)

探索性空间数据分析旨在揭示对象的空间分

布,识别非典型空间位置(空间离群点),发现空间关联模式,提出不同空间体制及其他形式的空间不稳定性[11]。ESDA的核心内容是通过全局空间自相关分析和局域空间自相关分析对空间关联模式(趋同或异质)进行度量与检验,其中全局指标反映的是某种属性值在整个研究区域的空间关联模式,而局域指标用于反映一个区域单元上的某种属性值与邻近区域单元上同一属性值的相关程度[12]。2.1全局空间自相关分析

全局空间自相关是度量空间自相关的全局指标。衡量全局空间自相关的指标和方法主要包括全局Moran’sI和Geary’sC等。本文对全局空间自相关的度量和检验是基于全局Moran’sI指标,其计算公式为:

I=

nˉ)∑(x-x

i

i=1n

2

ˉ)(x-xˉ)∑∑w(x-x

ij

i

j

i=1j=1

nn

∑∑w

i=1j=1

nn

(1)

ij

式中:I为Moran指数;n为研究区域的总数目;xi

和xj为某属性特征x在区域i和j上的观测值;wij为行标准化的空间权重矩阵,通常被定义为一个二元对称矩阵W,用来表达n个位置的空间区域的

xˉ是某属性特征x在n个研究区域全邻近关系[13];

部观测值的平均值。

Moran’sI的值一般在[-1,1]之间,大于0一般表示空间正相关,说明经济发展水平较高(或较低)的区域在空间上显著集聚。值越趋近于1,区域间经济发展水平在空间上差异就越小;小于0表示空间负相关,表明区域与其周边地区的经济发展水平具有显著差异。值越趋近于-1,区域间经济发展水等于0的标准差。

零假设区域间不具有空间自相关性,是随机分布的。在正态分布中,置信度为0.05阈值为1.96。如果Z值在-1.96~1.96之间,那么符合零假设。如果|Z|值>1.96,则不符合零假设,即区域间存在显著的正(负)自相关性。当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚,高值区域与高值区域相邻接,低值区域与低值区域邻接。当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布,高值区域与低值区域相邻接,低值区域与高值区域邻接。

全局Moran’sI统计量是一种总体统计指标,仅反映在研究区域内,相似属性的平均聚集程度。当需要进一步识别不同类型的空间聚集模式,即是高值单元的聚集或是低值单元的聚集;哪个单元对于全局空间自相关的贡献更大;以及在多大程度上空间自相关的全局评估掩盖了反常的局部状况或小范围的局部不稳定性时,就必须应用局部空间自相关分析[7]。

2.2局部空间自相关分析

局部空间自相关分析可以度量每个区域与周边地区之间的局部空间关联和空间差异程度。主要方法包括:Gi统计量[14-15]、Moran散点图[16]、空间联系的局部指标(LISA)[17]。其中,Gi统计量是一种基于距离权重矩阵的局部空间自相关指标,能探测高值聚集和低值聚集,并且可以用来检测被全局分析掩盖了的局部小范围的相关性;Moran散点图主要是研究局部空间稳定性的方法,可以直观地反映区域单元与其邻居之间的空间联系形式。然而,Mo-ran散点图不能反映空间集聚程度,因此,Anselin定义了空间联系局部指标(LocalIndicatorsofSpatialAssociation,LISA)与Moran散点图一同协力检测局部空间的聚集性及分析局部空间的不稳定性[7]。本文采用的是基于GeoDa软件提供的Moran散点图

12期马晓熠等:基于探索性空间数据分析方法的北京市区域经济差异1557

2.2.1Moran散点图

Moran散点图即可以用来可视化全局空间自相关性,又可以研究局域的空间不稳定性。它的思

ˉ,路是将观测值向量y(y=x-x观测值与均值的偏差组成的向量)与其相邻区域值的加权平均值(滞后因子)Wy的数据对进行了可视化的二维图示。其中,横轴对应向量y的所有观测值,纵轴对应空间滞后因子Wy的所有取值。

[18]

ran散点图里的信息,可通过“Moran显著性图[19]”进行可视化显示。

3北京市区域人均GDP探索性空间

数据分析

3.1数据与空间权重矩阵3.1.1数据

本文采用的数据有两种类型:一类是地理空间数据,来源于1∶100万的中国行政区划图(图1);另外一类是统计数据,从2001-2007年《北京区域统计年鉴》中提取出的北京市18区/县的人均GDP数据和人口统计数据,其中GDP数据是名义人均GDP数据。虽然由于通货膨胀或紧缩问题,不同年份的经济数据存在明显的价格差异,但本文采用的研究方法只考虑同一年空间邻接或空间邻近的区域单元属性值的相似程度。因此,无论是用名义人均GDP还是实际人均GDP,都不会影响研究结果。3.1.2空间权重矩阵

在进行空间自相关性分析之前,,首先需要建立研究区内各区域间的空间邻近关系。本文采用的是突出空间单元间距离作用的基于距离的权重矩阵,方法是以距离阈值来定义权重,即如果任意两个区/县的多边形几何中心之间的直线距离d在阈值范围内则定义为1,否则为0。此权重矩阵较适用于研究区域中多边形的大小不是很均匀的状况(例如,研究区域外围是很大的多边形,而中心则是很小的多边形)。

基于距离权重的定义如下:

由于Moran’sI的值在形式上等于Wy对y的线性回归的斜率系数,因此Moran散点图可以可视化全局空间自相关性。而Moran散点图的4个象限,分别对应于区域单元与其邻居之间4种类型的局域空间联系形式:HH(/LL)象限代表了高观测值(或低观测值)的区域单元被同是高值(或低值)的区域所包围的空间联系形式;LH象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式;HL象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。

Moran散点图的重要优势在于其能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值中的哪种空间联系形式。并且,对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同形式。2.2.2LISA

空间联系的局域指标(LISA)是用来度量每个区域单元与其周边地区的属性值之间的显著空间聚集程度的指标。作为LISA的局域Moran’sI是全局Moran’sI统计量的局部化版本,被定义为:

(xi-u)Ii=wij(xi-u)(3)

m0∑j

i

式中:m0=∑(xi-u)2n;xi为某属性特征x在区域i的观测值;u是所有观测值的平均值。当局域

Moran’sI通过检验达到显著性水平,有显著的正向空间自相关时,说明某区域与跟它观测的属性值相似的区域邻近,形成空间聚集。其中,当区域与相邻区域的属性值都较高时,为热点,可用HH表示;当区域与相邻区域的属性值都较低时,则为冷点,可用LL表示;如果区域本身属性值高,而其周围区域的值低(LH)或是其本身属性值低,周围区域的高(LH),即有显著的负向空间自相关时,则为空

图1北京市行政区划图

1558地理科学进展29卷1

wij=

{

1区域i与j的距离在给定的距离d之内时0其他

区继昌平区后也进入到了LH象限,导致北京市经济发展水平在空间上有向负的空间自相关性发展的趋势。

下面利用LISA指数对2001-2007年北京市18区/县的人均GDP的局部空间相关性进行衡量,作聚集分析,有助于更好地理解数据的地理分布位置,更直观地了解北京市各区/县的经济差异分布格局。

表1北京市18区/县空间权重矩阵特征

Tab.1Thecharacteristicsofspatialweightmatrix

邻接区域 

个数 0 西城区、崇文区、宣武区、朝阳区、丰台区、石景山东城区 1

区、海淀区、通州区、昌平区、大兴区 12 西城区 东城区、崇文区、宣武区、朝阳区、丰台区、石景山

区、海淀区、门头沟区、房山区、通州区、昌平区、大兴区 9 崇文区 东城区、西城区、宣武区、朝阳区、丰台区、石景山

区、海淀区、通州区、大兴区 12 宣武区 东城区、西城区、崇文区、朝阳区、丰台区、石景山

区、海淀区、门头沟区、房山区、通州区、昌平区、大兴区 10 朝阳区 东城区、西城区、崇文区、宣武区、丰台区、石景山

区、海淀区、通州区、顺义区、大兴区 1 东城区、西城区、崇文区、宣武区、朝阳区、石景山丰台区 1

区、海淀区、门头沟区、房山区、通州区、大兴区 1 东城区、西城区、崇文区、宣武区、朝阳区、丰台区、石景 1

山区 海淀区、门头沟区、房山区、昌平区、大兴区 

1 东城区、西城区、崇文区、宣武区、朝阳区、丰台区、海淀区 1

石景山区、门头沟区、房山区、昌平区、大兴区  西城区、宣武区、丰台区、石景山区、海淀区、房山门头 6

沟区 区 

7 房山区 西城区、宣武区、丰台区、石景山区、海淀区、门头

沟区、大兴区 

 东城区、西城区、崇文区、宣武区、朝阳区、丰台区、通州区 7

大兴区 

 朝阳区、平谷区、密云县 顺义区 3

 东城区、西城区、宣武区、石景山区、海淀区 昌平区 5地区 

0 东城区、西城区、崇文区、宣武区、朝阳区、丰台区、大兴区 1

石景山区、海淀区、房山区、通州区  延庆县 怀柔区 1

 顺义区、密云县 平谷区 2 密云县 2 延庆县 1

顺义区、平谷区 

怀柔区 

通过Anselin设计的GeoDa软件,设置参数距离d(约36,000m)以满足每个地区至少有一个邻居,并且能够最大限度的反映空间自相关性这两个基本条件,得到的空间权重文件的信息即北京市18区/县的邻接矩阵特征如下面表1所示。3.2全局空间自相关分析

表2列出了2001-2007年间北京市18个区/县人均GDP的全局Moran’sI统计结果。从表中可以看出北京近7年间,除了2002年,Moran’sI指数值呈逐年下降趋势。在所列的Moran’sI统计值中只有2002年的是通过了0.05的显著性水平检验,即其Z值为2.060722,大于1.96。这个结果说明只有2002年北京市人均GDP的分布存在显著的正的空间自相关性,也就是拥有较高(或较低)人均GDP的区域与其他同样拥有较高(或较低)人均GDP的区域相邻,即在空间上成聚集分布。而其他年份的北京市人均GDP的空间分布特征并不明显。2004年人均GDP在空间上基本呈随机分布,而自2005年后开始有逐渐向负的空间自相关性发展的趋势。3.3局部空间自相关分析

Moran’sI统计值是一个全局指标,只能反映2001-2007年北京市人均GDP在整个研究区域的空间关联模式,即是趋同、异质或是随机分布。然而当需要进一步考虑是否存在某些区/县人均GDP的高值或者低值的局部空间集聚、哪个区域空间单元是造成Moran’sI指数值呈逐年下降的趋势以及是否存在局部区域的空间异质性时,就需要应用局部空间自相关分析法。

图2显示了2001-2007年间北京市18个区/县人均GDP的Moran散点图。Moran散点图指出了

各区/县所在的象限,图中蓝线的斜率可以直观的表2北京市18个区/县2001-2007年地区人均生产总值(GDP)

看出Moran’sI指数值除2002年外呈逐年下降趋势,即北京市各区/县的人均GDP的整体空间分布有由正的空间自相关向负的空间自相关转变的趋势。形成这一转变的主要原因是由于2003年原本属于HH象限的昌平区进入到了LH象限,暗示其经济发展开始落后于周围地区,使得全局正的空间自相关性显著降低;而2004年起西城区进入到了HL象限,说明其经济发展明显高于周围地区,它的改变对全局自相关性产生了很大的影响,使原有的

的全局Moran’sI统计值

Tab.2Moran’sIstatisticsforpercapitaGDPofBeijing’s

eighteendistrictsorcounties,2001-2007

2002 2003 2004 2005 2006 

0.1812 0.0886 -0.0186 0.0081 -0.0232 

0.074508 0.074504 0.074359 0.074335 0.074339 

2.060722 1.274886 0.451145 0.033128 

0.015104 

五星文库wxphp.com包含总结汇报、考试资料、专业文献、教学教材、旅游景点、文档下载以及基于探索性空间数据分析方法的北京市区域经济差异_马晓熠等内容。

本文共2页12


  本文关键词:基于探索性空间数据分析方法的北京市区域经济差异,由笔耕文化传播整理发布。



本文编号:88774

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/quyujingjilunwen/88774.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b4106***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com