第2章 区域城镇化与工业化的因果关系:模型与实证
本章将经济学的理论和方法引入到地理学研究中,基于城镇化与工业化协同发展数据库,利用Granger因果检验模型,通过三次产业与城镇化关系的单位根检验、协整检验和因果关系检验,解析区域城镇化与工业化在时序上的互动关系,并进一步揭示二者之间关系的区域差异。
一、指标、数据与样本
学术界对城镇化水平的衡量指标有两种倾向:一是综合指标,即采用多个指标构成的指标体系来衡量城镇化水平;二是单一指标,即采用某一具体指标来衡量城镇化水平。虽然用综合指标衡量城镇化水平会对各地区的城镇化水平有全方位的评价和把握,但是目前学术界对这一综合指标还没有达成统一的认识,即没有一个指标体系是可以较好地综合反映所有地区的城镇化发展情况。鉴于这种情况,本研究对城镇化水平的衡量仍然采用单一指标。
但是,目前我国对于不同省份城镇化水平只在普查年份公布,非普查年份未公布,只有节点数据而没有时序数据,而在关于城镇化水平相关的时序数据方面唯一能够从《中国人口统计年鉴》上搜寻到的资料或者为过分夸大的市镇人口数(三普标准),或者为偏小的市镇非农业人口数(二普标准)。周一星、田帅(2006)利用五普数据对我国各省市的城镇化水平进行了修补,修补后的数据较好地解决了统计数据的虚假性和不连续性,因此,本章各省市的城镇化水平数据采用的是该文修正后的数据(1982-2000),有的省份可以查到根据2000年“五普”推算的人口数据则予以补充至2004年。
由于对产业结构演变可以有不同层次的理解,因此,各国学者在研究产业结构演变问题的时候,都是根据自己的研究目的选择不同的指标。本研究的目的在于揭示第一、二、三产业的发展演化与城镇化之间的互动关系,因此不对工业内部或者服务业内部行业进行细分。在指标上,本研究选择各省区第一、二、三产业增加值占GDP的比重进行分析,而没有选择就业人口数据。因为就业人口数据和城镇化人口数据存在着逻辑上的直接联系,如果用就业人口数据作为产业结构的衡量标准,其与城镇化在很大程度上是同义语(详见Moir,1976)。
研究区域选择的是除港、澳、台及重庆和海南之外的我国全部省、自治区、直辖市。之所以没有将重庆和海南列入计算是由于重庆是1997年才被列为直辖市,海南也是1988才从广东省划出成为独立核算的省。本章主要是基于对时间序列数据的考察,而重庆和广东数据在被划出之前都是包括在四川和广东的数据之内,因此考虑到四个省市的时间序列数据的延续性,本研究未将重庆和海南列入考察范围。
二、Granger因果检验
1.检验方法
Granger因果关系检验(Granger Causality Test)在考察序列x是否是序列y产生的原因时采用这样的方法:先估计当前的y值被其自身滞后期数取值所能解释的程度,然后验证通过引入序列x的滞后值是否可以提高y的被解释程度。如果是,则称x是y的Granger成因(Granger Cause),此时x的滞后期系数具有统计显著性。一般地,还应考虑问题的另一方面,即序列y是否是x的Granger原因。
针对模型:
(2.1)
Granger非因果关系的原假设可以表示为β1=β2=……=βp2=0,xt不是引起yt+1变化的原因。对于Granger非因果关系,原假设的检验统计量为
(2.2)
其中,RSSu表示无约束条件下的残差平方和,RSSc表示在原假设约束下的残差平方和。检验统计量F服从自由度为(P2,T-P1-P2-1)的F分布。如果F值大于临界值的话,我们就可以拒绝原假设β1=β2=……=βP2=0,也就是说x是y的Granger原因。反之,我们不能拒绝原假设,认为x不是y的Granger原因。[1]
Granger因果关系可以分为三种情形:
(1)单向因果。xt是yt+1的原因,但yt不是xt+1的原因。
(2)双向因果。xt是yt+1的原因,同时yt也是xt+1的原因。
(3)如果xt不是yt+1的原因,同时yt也不是xt+1的原因,则称二者独立。
2.相关说明
Granger因果检验的结果实际是通过回归模型的显著性来判断的,其模型的实质是以时间序列数据进行回归分析,而对于时间序列数据的回归分析,则必须先进行变量的平稳性检验,否则分析时会出现“伪回归”现象,以此做出的结论很可能是错误的。所以在Granger因果检验之前必须进行单位根检验,关于这点,基本上所有的研究都达成了共识。但是在以下几个方面,不同研究的做法不一,本研究采用学术界普遍认可的方法,并在此给予说明。
(1)是否需要做协整检验
关于这个问题,Granger(1988)指出,“在非协整情况下,任何原因的推断将是无效的。”因此,一个完整的Granger因果检验过程可以描述为时间序列的单位根检验、变量的协整检验和Granger因果关系检验。Granger在1988年发表的文章《Some recent development in a concept of causality》中也提到了“在非协整情况下,任何原因的推断都将是无效的”。因此,目前大多数研究在做Granger因果检验时都首先进行序列的平稳性检验。
(2)Granger因果检验中的滞后阶数选择
因为做Granger因果检验的常用软件是Eviews,但是用EViews软件操作时,只给出了一个滞后项,即Yt、Xt取相同的滞后项,也因为这个原因,在操作时令m=k=p。因此,各种研究常用的做法是将Yt、Xt选取相同的滞后项p,而由于Granger因果检验对变量的滞后项有很强的敏感性,因此通常对不同的滞后长度进行试验,以确信结论是稳健的,而不依赖于模型的设定。当确信Granger因果检验不依赖滞后项时,对结果的解释应该指出在一定的概率下,因果关系是成立或不成立的,比单独地指出在滞后几阶的情况下,Granger因果关系成立或是不成立都有更大的意义。
(3)“Granger因果检验”与“因果关系”的标准含义关系
Granger因果检验并不是检验因果关系。这一点从Granger因果检验建立的回归方程来看也很明显,如果A是B的Granger成因,只表示A过去的信息值有助于预测B,Granger因果检验的重要价值在于预测。Granger因果检验只是一种统计意义上的检验,是其真正因果性的一种支持,但不能作为最终依据,还需要根据经济理论进行进一步的分析。统计意义上的因果性对经济预测起很大的作用。
(4)Granger因果检验的效力
虽然变量的不平稳性是造成虚假因果关系最主要的因素之一,但是小样本的存在会导致真实因果关系检验不出的错误。随着样本容量的逐渐增大,判断出两个平稳序列存在Granger因果关系的概率将会增大。尤其是当样本小于20的情况下,如果经Granger因果关系检验结果为“存在因果关系”,则可以用90%以上的概率保证所研究变量间存在真实的因果关系;反之,如果检验结果为“不存在因果关系”,则不能断定变量间不存在真实的因果关系。
三、城镇化与工业化因果关系的实证检验
1.时间序列的单位根检验
社会经济的时间序列经常是非平稳序列,如果用非平稳经济变量建立回归模型就会带来虚假回归的问题,因此需要对其做平稳性检验,如果一个时间序列的均值或是自协方差函数随时间而改变,那么这个序列就是非平稳序列。随机过程,{yt,t=1,2},……,若yt=∅yt-1+εt,其中,∅=1,εt为稳定过程,且E(εt)=0,cov(εt,εt-ξ)=μt<∞,这里ξ=0,1,2,……,则称该过程为单位根过程。若单位根过程经过一阶差分成为平稳过程,即yt-yt-1=(1-B)yt=εt,则时间序列yt称为一阶单整序列,记做I(1)。如果非平稳序列xt经过d次差分达到平稳,则称其为d阶单整序列,记做I(d),其中,d表示单整阶数,是序列包含的单位根个数。
本研究运用扩充迪基-富勒检验(Augmented Dickey Fuller Test),模型如下:
(2.3)
其中,εt为白噪声,Δ为一阶差分算子,原假设H0:β1=0即序列yt有一个单位根(是非平稳的)。t为时间趋势。检验采用Mackinnon临界值与ADF值相比较,小于临界值则序列是平稳的,否则是不平稳的。Δyt-1的最优滞后期使用赤池准则的AIC决定。
对29个样本省区的城镇化率和第一、二、三产的产值结构的数据进行单位根检验,分别记为lar,lin,lse,lur,检验结果见表2.1。
表2.1 变量平稳性检验结果
2.时间序列的协整检验
时间序列虽然自身非平稳,但是其某种线性组合却平稳,这个线性组合反映了变量之间长期平稳的比例关系,即称为协整检验(Cointegration)。
本研究采用Engle Granger两步法(EG检验)。第一步是检验yt与xt的单整阶,要求yt与xt同阶;若yt与xt都是d阶单整,用一个变量对另一个变量回归即有
(2.4)
yt=α+βxt+εt
第二步是用OLS方法建立如下模型,用和表示回归系数的估计值,则模型残差估计值为
然后对残差作平稳性检验,若~I(0),则解释变量与被解释变量之间存在协整关系,否则不存在协整关系。
3.Granger因果关系检验
协整检验只能揭示变量之间是否存在长期稳定关系,不能揭示出关系的方向,因此,我们需要进一步对变量进行因果关系检验。Granger因果关系检验实际上是建立在两个回归的基础上,所以在进行检验前都应考察序列的平稳性。而在对非平稳序列进行因果关系检验前应对序列进行协整检验,若二者存在协整关系,再对二者进行因果关系检验。以四川省为例,因果关系检验的结果详见表2.2。
表2.2 四川省城镇化与工业化的Granger因果检验结果
四、城镇化与工业化关系模式的分类解析
1.协整关系检验的结果及省区归类
协整关系检验反映的是变量之间有无长期平稳的关系,凡是通过协整检验的省区,则表明该省区通过检验的两变量之间存在长期稳定的关系。协整检验结果表明:虽绝大多数省区的城镇化与工业化之间存在着长期的稳定关系,但仍有部分省区的二者之间缺乏长期稳定关系,这就说明了省域尺度上城镇化水平与产业结构之间实际上存在多样化的关系,同时也意味着二者之间的关系与区域工业化和城镇化过程的特殊性联系在一起,而国家层面存在的统计关系可能在较小空间尺度内并不能够得到足够的体现。因此,可以依据它们的城镇化水平与第二产业产值比重、第三产业产值比重以及整个非农产业产值比重之间分别有无协整关系,对各省区进行模式分类(表2.3,图2.1):
表2.3 协整关系检验结果分类
(1)类型Ⅰ:城镇化水平与产业结构之间不存在协整关系
该类型包括了大部分的中西部省区,分别为河南、云南、贵州、新疆、西藏、江西、湖南、陕西、甘肃、宁夏,它们的共同特点是城镇化和产业结构的发展阶段都处于初级阶段。
图2.1 基于协整关系结果的省区分类
(2)类型Ⅱ:城镇化水平与仅第二产业产值比重之间存在协整关系
该类型所包含的两个省区为江苏和内蒙古,其城镇化水平发展仅与其各自的第二产业产值结构的变动具有长期稳定的关系,但是值得注意的是它们的回归方程相关系数分别为0.417和0.449,模型的拟合优度不够,这从一个方面说明这两个省区的城镇化水平的发展过程虽与其第二产业产值结构的发展密切相关,但相关程度较弱。
(3)类型Ⅲ:城镇化水平仅与第三产业产值比重之间存在协整关系
该类型共包含四个省、市、自治区,除北京外均为中部省区,分别为安徽、广西、湖北,但广西的相关性较弱(拟合优度为0.650)。从整体上看,改革开放以来它们的第二产业发展并不理想,工业结构偏重,发展过程出现过很强的波动,因此,在协整关系检验结果上,它们的城镇化发展过程仅与各自第三产业产值结构的变动存在长期稳定关系。
(4)类型Ⅳ:城镇化水平与二产业产值比重、三产业产值比重均存在协整关系
该类型共包含13个省、市、自治区,东部绝大多数省区都包括在这一类型中,分别为辽宁、天津、河北、山东、上海、浙江、福建、广东、黑龙江、吉林、青海和四川、山西,其中青海的三个模型拟合优度均较弱。在这一类型中的省区,它们城镇化水平的发展与第二、三产业产值结构的变动均存在长期稳定的关系,也即城镇化水平的发展与整个非农产业的发展紧密相关。
2.因果关系检验的结果及省区归类
由于协整检验只能揭示变量之间是否存在长期稳定关系,却不能揭示出这种关系的方向,而因果关系则说明了两变量之间的关系方向,因此,通过上述Granger因果关系检验,我们可以依据29个样本的城镇化水平与二产产值、三产产值及非农产业产值比重之间的Granger因果关系的有无及其方向,把它们划分为4个大类,8个小类(见表2.4,图2.2):
表2.4 Granger因果关系检验结果分类
(1)类型Ⅰ:城镇化水平与产业结构之间不存在Granger因果关系
该类型与前面协整检验的结果一致,包括十个省区。
图2.2 基于Granger因果检验结果的省区分类
(2)类型Ⅱ:城镇化水平与第二产业产值比重之间具有Granger因果关系
这一类型包括两个小类:
①城镇化水平的提高是第二产业产值比重变化的Granger原因,可以理解为城镇化水平的发展带动了当地第二产业的发展,这一类中仅包括河北省。
②城镇化水平的提高与第二产业产值比重的变化互为Granger原因,即城镇化水平的发展与当地第二产业的发展相互作用,互为因果,这类省区包括江苏、内蒙古和四川。
(3)类型Ⅲ:城镇化水平与第三产业产值比重之间具有Granger因果关系
这一类型包括三个小类:
①第三产业产值比重的变化是城镇化水平提高的Granger原因,可以认为第三产业的发展是当地城镇化水平提高的重要原因,这一类型包括北京和广西。而在前面的横向对比中我们就可以发现,北京和广西的第三产业发展程度相较与自身的第二产业大大超前。
②城镇化水平提高是第三产业产值比重变化的Granger原因,也就是在这一类型中城镇化的发展带动了当地第三产业的发展,代表省份是浙江。
③城镇化水平的提高与第三产业产值比重的变化互为Granger原因,属于该类型的是安徽、湖北和山西。
(4)类型Ⅳ:城镇化水平与整个非农产业产值比重之间具有Granger因果关系
该类型也包括三个小类:
①非农产业产值比重的变化是城镇化水平提高的Granger原因,即第二、三产业的共同发展带动了当地城镇化水平的提高,该类型包括山东和青海。
②城镇化水平提高是非农产业产值比重变化的Granger原因,可以理解为,当地较高的城镇化水平或快速的发展过程带动了当地非农产业的发展,该类型包括辽宁、黑龙江和吉林三个东北老工业基地省份。
③城镇化水平的提高与非农产业产值比重的变化互为Granger原因,属于该类型的有天津、上海、福建和广东,除天津外,其余省市改革开放以来无论是城镇化进程还是非农产业发展速度都居全国前列。
五、城镇化与工业化因果关系的初步解释
为进一步解释Granger因果检验的结果,我们进行了以下两方面的延伸性分析:一是各省区非农就业和城镇化的年均增长率,二是非农产业的产值与就业偏离度。对于前者,我们采用樊杰和田明(2003)的研究结果(表2.5)。对于后者,我们采用结构偏离度的方法进行测度和考察。
表2.5 1980-2000年工业化与城镇化发展的等级划分
所谓结构的偏离程度,也就是产业结构中的产值结构和就业结构的变动是否处在同步变化和对称状态,其计算公式为
(2.6)
式中,E表示偏离度,Yi为各产业劳动力所占比例,Xi表示各产业产值结构所占比例。偏离度越高说明两者越是处在不同步变化和不对称状态;反之,越接近对称状态。
结构偏离度与劳动生产率成反比,结构偏离度大于零——正偏离,也即该产业的就业比重大于增加值比重,意味着该产业的劳动生产率较低,存在着劳动力转移出去的压力,如发展中国家的农业部门由于劳动生产率较低就存在着向其他产业转移劳动力的压力和趋势。负偏离则意味着该产业的劳动生产率较高,该产业存在着劳动力迁入的压力。从理论上看,如果各个产业是完全竞争的,并且劳动力是可以自由流动的,那么劳动力就会向劳动生产率较高和收益较高的产业转移(实际上劳动生产率较高往往意味着收益较高),直到几个产业之间劳动生产率和收益基本相等时劳动力在各个产业间的流动才会停止。在理论上结构偏离度为零才是均衡状态,此时各产业的劳动生产率相同。所以,从各个产业结构偏离度的正负可以判断出该产业是排挤出劳动力还是吸收进劳动力。
产业结构演变是就业结构变化的关键影响因素。经过20多年的快速发展,中国省域非农就业水平有了明显的提高,但除京津沪三个直辖市外,各省区市非农产值比重仍远高于非农就业比重。表2.6和表2.7分别为1982-2004年间我国分省二、三产业的平均偏离度比较,从整体来看,1982-2004年间我国第二产业和第三产业的平均偏离度都为负值,尤其是我国二产的平均偏离度达-20.2。通过对比可以发现,东部沿海省市(除山东、河北以及江苏外)的二产偏离度普遍高于全国的平均值,以上海、北京和天津三个直辖市为最,高于全国平均值一个标准差还多,这与这些省市改革开放之后轻工业的迅速崛起有很大关系。负向偏离程度最大的省份多位于西部地区,其中云南、甘肃、贵州为最,低于或接近全国均值1个标准差。
表2.6 1982-2004年分省二产平均偏离度比较
从整体来看,我国1982-2004年分省第三产业的偏离度也均为负值,三产业偏离度高于全国平均水平的省市仍多集中于东部沿海地区(除浙江、山东、河北、广东、福建),其中北京、上海、天津三个直辖市的平均偏离度接近1,这说明从长期来看,这三市的第三产业的产值和就业结构处于均衡状态,此消彼涨。黑龙江、吉林、辽宁三个东北老工业基地的三产平均偏离度也接近1,这从一定程度说明其早期工业的发展为其第三产业的发展奠定了基础,偏重的工业结构虽未吸纳足够多的就业,但其第三产业从长期来看发挥了吸纳就业的积极作用。其余省市自治区除湖北、安徽、内蒙古、新疆之外,其三产平均偏离度均低于全国平均水平,偏差值均低于-10。
表2.7 1982-2004年分省三产平均偏离度比较
以上分析结果可以综合体现在表2.8中,将其与表2.4的结果对比,有助于进一步理解城镇化与工业化之间不同因果关系模式的形成原因。
(1)城镇化与第二产业、第三产业或者整个非农产业之间有双向Granger因果关系的省区大部分是非农就业平均增长率与城镇化年均增长率都较高的省区,但这种Granger因果关系与非农产业的平均偏离度并没有明显关系,如江苏、福建、广东、安徽、湖北和四川。
(2)城镇化与第二产业、第三产业或者整个非农产业不存在任一方向上的因果关系的省区大部分是非农就业平均增长率与城镇化年均增长率都较低且非农产业的整体平均偏离度大的省区,如陕西、云南、贵州、宁夏和湖南。
(3)北京和广西虽在整体经济发展速度上有很大差别,但改革开放以来它们的非农就业平均增长率和城镇化的年均增长率都较高,而且他们在产业结构的演变上也有共性。1982年广西和北京的三次产业结构分别为48.7:26.9:24.4和6.7:64.4:28.9,而2000年则分别演变为26.3:36.5:37.2和3.6:38.1:58.3,第三产业产值增长速度已经超过第二产业。北京的这种产业结构转变是经济发展到一定阶段的必然,但广西则是工业发展滞后而第三产业超前发展的结果。因此,这两个省市较高的城镇化发展只能是第三产业带动的结果,因此在检验结果上也表现为他们的第三产业产值比重的变化是城镇化水平提高的Granger原因。
(4)辽宁、吉林、黑龙江三个东北老工业基地省份的非农就业增长率均显著低于城镇化年均增长率,虽然辽宁和吉林的非农产业整体平均偏离度小,但是改革开放以来东北地区非农产业发展速度缓慢,不能有效吸纳就业已是不争的事实。因此,在检验结果上这三个省份表现为城镇化水平的提高成为其非农产业产值比重增加的Granger原因。
(5)山东和青海在检验结果中虽属于同一类型,即“非农产业产值比重的变化是城镇化水平提高的Granger原因”,但他们本质上却是因为不同的原因引起的。山东的非农就业平均增长率与城镇化年均增长率均较高,但是二产平均偏离度较大。这说明在山东工业产值结构更加迅速增长的同时,就业的增长没能及时跟上,工业就业短缺仍然存在,而改革开放以来山东的经济重心与人口重心的长期错位也充分证明了这一点。青海虽非农就业和城镇化年均增长率都偏低,但青海的非农产业产值结构的发展程度高于绝大多数西部地区,甚至还优于个别东部省区,2000年青海的三产产值结构为14.6:43.2:42.1,非农产业发展速度很快,虽然非农就业结构未能跟上,但是其已经构成了青海城镇化发展的重要动力。
(6)天津、上海、内蒙古的非农产业整体平均偏离度都较小,说明它们的就业结构与产值结构长期以来发展比较均衡,这也在一定程度上解释了他们的非农产业产值结构(二产产值结构)变化与城镇化水平之间存在双向Granger因果关系。
(7)浙江和山东在因果关系检验中不属于同一类型,但是它们作为城镇化和非农就业年均增长率都很高的省份,其城镇化与非农产业之间没有形成互为因果的关系。这与这两个省份长期以来外延式的人口和产业的增长方式有很大关系,以浙江为例,20世纪80年代中后期乡镇企业的崛起虽吸纳了大量农村剩余劳动力,但这种产业和人口中小城镇集中度大,产业松散布局的发展模式直接导致了浙江的城镇化水平与其经济发展水平的错位。在检验结果上也表现为浙江的人口城镇化过程与其二产产值的变化过程不存在任一方向上的Granger因果关系,也就是说浙江的工业化过程没有与其城镇化形成互动演化关系。
表2.8 基于非农就业、非农产业偏离度与城镇化关系的省区分类
六、小结
本章将经济学理论和方法引入到地理学研究中,基于Granger因果检验模型,以1982-2000的各省区城镇化水平和三次产业产值结构数据为基础,通过对改革开放以来我国各省区城镇化和产业结构互动关系的解析,揭示城镇化与工业化因果关系的省际差异,并对导致这种差异的原因进行了探讨。研究发现:
(1)工业化与城镇化之间确实存在密切的联系,长期看来二者还具有相互作用、互为因果的关系。
(2)这种关系的强弱在不同的产业和社会发展阶段表现形式不同。快速城镇化地区城镇化与非农产业结构之间均存在长期稳定关系;发展速度慢的地区二者之间关系不明显,其中10个省区的城镇化水平与非农产业产值比重之间尚不存在明显的长期稳定关系。
(3)对于处在不同发展阶段的省区,城镇化与工业化的因果关系也有差别。这种差别总体上看符合国际上的一般认识,即工业化中期阶段的城镇化主要是第二产业发展推动的结果,而后期阶段主要与第三产业的发展关系密切,但个别省区也存在特殊情况。
(4)非农就业的发展速度对城镇化与工业化关系的形成产生了重要影响。城镇化与第二产业、第三产业或整个非农产业之间存在双向Granger因果关系的大都是非农就业年均增长率较高的省区。因此,夯实城镇化的就业基础、提高城镇的就业吸纳能力是提高区域城镇化与工业化协同发展水平的关键途径。
参考文献
樊杰,田明.中国城市化与非农化水平的相关分析及省际差异[J].地理科学.2003,23(6):641-649.
方甲.产业结构问题研究[M].中国人民大学出版社.1997.
周一星,田帅.以“五普”数据为基础对我国分省城市化水平数据修补[J].统计研究.2006,1:62-66.
Granger C. W.J.Some Recent Development in A Concept of Causality[J].Journal of Econo-metrics,1988,39(1-2):199-211.
Moir H. Relationship between Urbanization Level and the Industrial Structure of the Labor Force[J].Economic Development and Culture Change,1976,25(1).