2.3.2 群间不平等指标
通常用来度量收入差距的不平等指标有基尼系数、泰尔指数、变异系数、阿特金森指数等,但这些指标度量的是总体收入差距,也称为群内不平等指标(intra-income inequality ratios)。而我们所关注的城乡收入差距,是指将城镇居民、农村居民各自作为一个整体,分析两者之间的收入存在多大的差异,这就需要对总体不平等进行分解,得到群内不平等和群间不平等,而群间不平等就可以作为城乡收入差距的表征。还有一种群间不平等指标并不是通过子群分解得到的。如经济距离(economic distance)指标度量的是收入分布之间的不平等(Dagum,1980)。但经济距离只能反映城镇每一个居民收入比农村居民收入高的概率,而无法反映城镇居民收入到底高了多少注1。鉴于经济距离和包括阿特金森指数在内的福利测度方法应用较少,因此笔者只比较基尼系数和泰尔指数这两个最常用的不平等指标。
注1经济距离d0的计算公式为:d0(x, y)=P(Y>X|μu>μr)。式中:μu表示城镇的人均收入;μr表示农村的人均收入;d0表示给定城镇人均收入大于农村人均收入的前提下,城镇居民收入大于农村居民收入的概率。
基尼系数是个体收入两两比较后的一个相对数,反映了收入的不均等程度。常用的计算公式为:
式中:G代表基尼系数;n代表总人口;μ代表总体的平均收入;xi、xj分别代表第i、j 个人的收入。
Mookherjee和Shorrocks(1982)给出了基尼系数的子群分解式:
式中:pk和ph分别代表第k个子群和第h个子群的人口份额;μk和μh分别代表第k个子群和第h个子群的收入均值;Gk代表第k个子群内部的基尼系数;R 代表由于子群间收入重叠而产生的剩余项。
那么当只有城、乡两个子群时,基尼系数的分解式为:
式中:p r和p u分别代表农村和城镇的人口份额;μr和μu分别代表农村和城镇两个群体的收入均值;Gr和Gu分别代表农村和城镇内部的基尼系数;R 代表由于城、乡收入数据重叠而产生的剩余项;是群间不平等指标,可以作为城乡收入差距的度量。在下文中将详细比较不同的城乡综合基尼系数计算方法和分解式。
Theil(1967)利用信息论中平均信息量这个概念的类推,将熵应用于收入分配中,将收入不平等的测量解释为由人口份额转换成收入份额的消息所含的期望信息量,从而提出了两个泰尔指数。泰尔指数是一般熵指数(general entropy)的特殊形式。Cowell(1977)给出了平均信息量的一般形式,也就是一般熵指数,用GE表示:
当α分别趋向于0和1时,可以得到两个泰尔指数——泰尔第二指数T0和泰尔第一指数T1。
泰尔第一指数即GE(1),也称泰尔-T指数:
泰尔第一指数的城乡分解式为:
式中:θr和θu分别代表农村居民收入和城镇居民收入占全国的收入份额,,;xr和xu分别表示农村和城镇的人均收入;和 分别表示农村和城镇的泰尔第一指数;表示城乡收入差距。
泰尔第二指数即GE(0),也称泰尔-L指数,或称均值对数离差(mean logarithmic deviation, MLD):
泰尔第二指数的城乡分解式为:
式中:和分别表示农村和城镇的泰尔第二指数;表示城乡收入差距。
可以看到,泰尔指数不会像基尼系数那样由于城乡收入差距的重叠而产生剩余项。
接下来,笔者将从以下三个方面比较基尼系数和泰尔指数。
第一,指标的含义。基尼系数含义的明确性是其他指标无法企及的。从原始公式上看,基尼系数代表了两两比较的收入差距,这正符合人们日常的比较行为——与别人相比;从几何意义上看,它表示了人口份额与收入份额的匹配程度。泰尔指数虽然也反映了将人口份额转换成收入份额的消息所含的期望信息量,这一点与基尼系数所反映的人口份额与收入份额的匹配性类似。但是信息量这种概念在理解上有些困难。而且,泰尔指数由于没有与之对应的几何图形,在理解上远没有基尼系数那么直观。
第二,指标的分解。泰尔指数满足可加可分解性(Shorrocks, 1980),而基尼系数则不一定满足,它取决于子群收入是否存在重叠。不满足可加可分解性的后果就是子群分解不能分解成群内差异贡献加上群间差异贡献的形式,会出现剩余项。因此,泰尔指数是城乡收入差距分解的首选指标。而且泰尔指数在分解时,群内不平等和群间不平等要么都采用收入份额作为权重,要么都采用人口份额作为权重,权重是一致的,但基尼系数并不如此。
第三,指标的敏感性。基尼系数对中等收入的变动敏感,而泰尔指数则对低收入的变动比较敏感(洪兴建,2008)。由于不同指标的敏感性不同,所以在实际测算城乡收入差距时就会得到不同的趋势。