////l
■刘颖谢萌丁勇
其中,ly.一Yil表示任何一对样本的收入差的绝对值,n是样本数量,p,是收入
/
一、基尼系数的概念
意大利统计学家C.基尼在其1912年发表的一书中,首次提出了一种不均等指数及其计算方法。此后,英国收入分配专家达尔顿(H.Dalton)在1920年的《收入不均等的测量》一文中首次在英文文献中介绍基尼的不均等指数,并把它称之为平均差指数,而且认为该指数可以用来研究收入分配问题。从此以后,基尼的不均等指数逐步受到更多人的重视,被后人称为基尼系数,并且成为反映社会分配不平等程度、一国国民收入分配差距的重要指标。基尼系数对评估宏观经济形式、调整政策、调节社会关系,具有重要的“决策依据”价值。
(一)几何意义
美国统计学家M.O.洛伦兹在1907年提出了著名的洛伦兹曲线。洛伦兹首先将一国总人口按收入由低到高排队,然后考虑收入最低的任意人口百分比所得到的收入百分比,最后将这样得到的人口累积百分比和收入累积百分比的对应关系描绘在图形上,即得到洛伦兹曲线(如图1)。横轴表示人口(按收入由低到高分组)的累积百分比。纵轴表示收入的累积百分比。洛伦兹曲线的弯曲程度反映了收入分配的不平等程度。洛伦兹曲线越向横轴凸出,与完全平等线之间的面积就越大,收入分配程度越不平等。
因此,可以将洛伦兹曲线与45度线之闻的部分A叫做“不平等面积”;A+B就是“完全不平等面积”。不平等面积与完全不平等面积之比,称为基尼系数,
D
均值。经过后人的改造,现在常用的基尼系数即相对基尼系数的一般计算公式可
.
,
厶
,
r
j、|
B
I
O
以表示如下:G=≠一=生且三{—一,其上h
2n‘m
∑∑ly;-yjI
工2
F
/
只
厶
/
中,ly;一yIl表示任何一对样本的收入差的绝对值,n是样本数量,队是收入均值。
二、基尼系数计算方法
现在,经济学家已经掌握了多种计算基尼系数的方法,例如:几何法(Geo-metricapproach)、基尼平均差法(Gini"s
/
o
/
A
/
圈2
只
Kendall和Stuart(1958年)在他们的(AdvancedTheoryofStatistics)一书中提出基尼系数等于基尼相对平均差的一半,这一个重要结论使基尼系数的计算方法又向前迈进了一步。基尼绝对平均
/
/
,/
//
//,//
◇
P
I
差(离散分布)表达式为:△:乓∑∑I
n
i=ij=1
A
./
B
//
o
/
Yl—yjl,连续分布表达式为:A=Elyi_yjl,其中ly;-yjl表示任何一对样本的收入差的绝对值,n是样本数量。基尼相对平均差
表达式为垒,所以基尼系数为:G=拿一=
ll,
‘“,
田1洛化兹一线
m艘llt
difference
approach)、协方差法
一
—1而广一一———i—一一
生!j!!
=竺i!!j!!
EElyi-yjl丁1∑∑max(O,y,-yj)
(Covarianceapproach)和矩阵法(Matrix
form
approach)。每一种方法都有它们各自的优点和适用范围,而且它们是相互统一和相互一致的。
(一)几何法
如果收入的分布为离散型分布,那么洛伦兹曲线以下部分即:B区域的面
-一l
(离散分布),G=舍=号篆吐=l—i1Jo!
Z也
Z“
啦7
(1一F劬)毡(连续分布)。
(三)协方差法
Stuart(1954)提出基尼绝对平均差可以表示为变量值yj和序号*(按收人大小从低到高排列,最贫穷的单位赋值为Ty=1,最富裕的单位赋值为*=N)的协方差的函数,但是把这个关系与计算基尼系数联系在一起还是由后来Anand提出的。
G=≠彳2A=2(}一B)=l-2B。当A--0时,
^十D
Z
积可以表示为:B=下1∑假+。棚ak。+u,
厶;=0
基尼系数为0,表示收入分配绝对平等;当B--O时,基尼系数为1,表示收入分配绝对不平等。基尼系数是0-1之间的数值,基尼系数越大,不均等程度越高;基尼系数越小,收入分配越平等。衡量收人差距的一般标准为:基尼系数在0.2以下表示高度平均;O.2-o.3之问表示相对平均;0.3-0.4之间表示较为合理;0.4—0.5之间表示差距偏大;0.5以上为差距悬殊。
(二)计算公式
根据新帕雷格拉夫经济学辞典,基尼系数的原始计算公式是:
n
其中P,是人口累积百分比,当收入Y=Yi的概率为皓上,则p产上;L是收入累积nn
离散分布:G:堡型趔是由
mu,
’
百分比,如果收入的平均数为u产上∑
II
i;l
Anand于1983年提出,因为i:上∑i:
ni=i
yi,那么【Fj一乞Yi。i为第i个样本,且
nuti}I
1’一
i=l'2,…n。所以基尼系数,G=I一乞a■一
i=0
,a一-I
半,cov(y一,)-}_y广里乒Il,,所以可
以写成G=丝盘盟:妻∑,,yl_
II
nuy
ut
i=1。
瑚(k-+U。
如果收入分布是连续型的,则B=
,I
r
型生,基尼系数为任意收入与其序号的协方差的函数。
连续分布:Lerman和Yitzhaki于1984年提出了关于连续分布的计算公
1
'1n’n
J
L(P)ltp,基尼系数=1—20
(二)基尼平均差法
J
12p)d9。
O
△=—≠—w三二lyi—yjI,0<A<20,
15
鼍甘鼻决簟
2004年第9期(总第177期)
式:因为在连续分布中基尼绝对平均差
rb
fb
有p(y.,1。)=l,O'y=bffry,
可以表达为:A=Ely.一Y,|_』
,l,
ly—xlf(x)f(y)
蝌慨:归≯
dxdy=2
F(x)【l—F(x)ldx,其中F为绝对
b
平均数的分布。经过部分积分和变量替
f
1
可舳,=旦案
、/IZ
(7)(8)
换后可以写成A=4
y(F(y)-丁1)f(y)dy,二
又。.¨=a+b彳y_a+b×旦争
由(7)、(8)联立可得
令f(y)dy=F(y),变积分区域【h,a】为【0,l】,
r
原式变为A=4
o¨
f.y(F)(F—i1)dF。F是一个
二
二
尘L:!篁塑:二!£塑互:
h
a+bx(N+1)/2
,——r一
h俪。
2v'x(a+b—N厂+I)
图3:Pen’sparade(列队分布)4
5
占占
乞E(gainIi—+j)pr(i—+j),pr(i--,j)=p.pj,己
J=l
i=1
在【o,l】之间的分布,其均值为_三一,所以
A--4cov(y,F(y))。由第二种方法定义基尼
系数G:叁…:地!(!必。
Z.Uy
Ily
Anand(1983)和Yitzhak(1984)用不
同的方法得到了一致的结果。协方差法已经被编写成程序,可以直接用统计软件包来计算基尼系数。
基于协方差法,下面介绍一种计算基尼系数的简单方法。
b何2vrr(a+b-N2丛)一b何一诉百
若令a显著小,则简化为:
鲤:
h
Pi=l,E是由Ei组成的kxk矩阵,E,,=E(gainli--*j);p=(pt,P2'…,曲7为由P.组成的kxl矩阵,m=(m.,m。…,mk)’为每一组收入的均值组成的kxl矩阵。所以m,p=
三
乞mip.=u,,P’EP为总的收入差距,基尼
i=1
2订(b掣一)VT(M)
、/丁(N+1)、/丁V
、/3
(9)
系数可表示为G=(m-p)。1P,EP。其中的E可以进行各种分解以得到我们所需分析的对象。由此看来,若要对基尼系数进行分解,则可以使用矩阵法。
三、结论1.第一种方法几何法简单明了,具有很强的直观性,除了本文中介绍的方法外,还有拟合曲线法,对洛伦茨曲线拟合曲线方程进而求得基尼系数;以及弓形面积法,根据弓形面积法的计算公式直接计算基尼系数。总的来说,用几何法计算基尼系数的精度比较低,只有通过细化分组来解决,分组越细,准确性越高,当组数趋于无穷大时,误差趋于零。
2.第二种方法基尼平均差法是协方差法的基础,虽然用这种方法计算基尼系数也很繁琐,但是它的思想和本质使得基尼系数不仅用于反映收入分配的不平等程度,还可以用于一切分配问题和均衡程度的分析,尤其可以用于描述财产、资本、资源、产品、市场等资源分配的均衡程度,大大地拓展了基尼系数本身的内涵。
3.协方差法是应用得最多,计算最简单的方法,由于它的优良品质,大部分统计软件以它的原理来编程-i十算基尼系数。
4.矩阵法为基尼系数的分解提供了便利,在计算出基尼系数值后,为了进一步研究收入分配差距的构成和成因,可以将基尼系数进一步分解。利用基尼系数分解法,分析各项收入来源在总收入中的份额、不均等程度及其对总差距的贡献;也可以利用此方法,分析收入差距的地区构成、行业构成和人员构成。基尼系数的分解方法属于前沿理论和方法,掌握矩阵法是把握基尼系数分解的前提。
(作者单位/中央财经大学经济学院,
上海金融学院)(责任编辑/李友平)
:义(坠!)(盥=!!:—L,/N-1一N+I一—b
联立(9)和(5):
c一%渺。
因为cov(yi,¨=q吖yp(yt,¨
㈩
(2)
仃,是个体收入标准差,盯ry是个体序号的标准差,p(y。,妨是Yi和Y,相关系数。
%:摩琴
型牡渊N
:盟f堕兰!)
G=击告洮m)鸨土=古×古×、/器、/孚=}
尘丛。上N3
结论:若Pen's
Parade为线性,基
尼系数=导(当N足够大)
初看此结论可能很奇怪,假如有2个这样的序列,(1,2,3,4,5)和(100,200,300,400,500),但这两个序列却具有相同的基尼系数值。这是因为尽管两者离散程度差异很大,但组(2)的每个数都是组(1)的100倍,也就是说组中的每个数与均值的相对程度是一样的,组(2)仅是组(1)按一定比例的扩大。
Parade在现实中是凸然而Pen"s的(见图3中的B曲线),即收入开始增长很慢,然后收入的绝对数逐渐增加,最
后收人增长速度也不断增快,B比A分配更加不公平。
(四)矩阵法
(3)
其中,∑fi-等!一).∑(i2-i(N+1)+
M蚤半)
Z
=删生6蜒№乳NN娅2IL+巡4盟
.‘.c:一2C矿ov(yi,1)一掣挚=
击昔毗1≯y骼
如果N足够大,型嚆』一一l:
(5)
q:、/亭
所以,盼击=-普p(‰训
(6)
矩阵法是Pyatt(1976)提出的,他定义基尼系数的表达式为两项的比率,即:
基尼系数可以分解为:常数X收入的标准差系数3×收入与序号的相关系数,or,斗yp都十分好计算,甚至可以手算得出结果。
假如Y和1有如下线性关系即列队分布曲线呈线形(见图3中的A直线),那么可以表示为:y=a+brv
G_{等。(a)gnl--T。;;荟m麟(o,yi一曲,称为
“平均收入差距”,如果每个个体可将他的收入与另一个体进行比较,当yi>yi时,则max(0,Y.一曲的值取Yi-yj,否则取零;㈣是收入的平均数U,。如果对人口分成K组,第i组人口占总人口比率为P。,
所以可以将平均收入差距定义为:乞
16
缝计与凌簟
三
////l
■刘颖谢萌丁勇
其中,ly.一Yil表示任何一对样本的收入差的绝对值,n是样本数量,p,是收入
/
一、基尼系数的概念
意大利统计学家C.基尼在其1912年发表的一书中,首次提出了一种不均等指数及其计算方法。此后,英国收入分配专家达尔顿(H.Dalton)在1920年的《收入不均等的测量》一文中首次在英文文献中介绍基尼的不均等指数,并把它称之为平均差指数,而且认为该指数可以用来研究收入分配问题。从此以后,基尼的不均等指数逐步受到更多人的重视,被后人称为基尼系数,并且成为反映社会分配不平等程度、一国国民收入分配差距的重要指标。基尼系数对评估宏观经济形式、调整政策、调节社会关系,具有重要的“决策依据”价值。
(一)几何意义
美国统计学家M.O.洛伦兹在1907年提出了著名的洛伦兹曲线。洛伦兹首先将一国总人口按收入由低到高排队,然后考虑收入最低的任意人口百分比所得到的收入百分比,最后将这样得到的人口累积百分比和收入累积百分比的对应关系描绘在图形上,即得到洛伦兹曲线(如图1)。横轴表示人口(按收入由低到高分组)的累积百分比。纵轴表示收入的累积百分比。洛伦兹曲线的弯曲程度反映了收入分配的不平等程度。洛伦兹曲线越向横轴凸出,与完全平等线之间的面积就越大,收入分配程度越不平等。
因此,可以将洛伦兹曲线与45度线之闻的部分A叫做“不平等面积”;A+B就是“完全不平等面积”。不平等面积与完全不平等面积之比,称为基尼系数,
D
均值。经过后人的改造,现在常用的基尼系数即相对基尼系数的一般计算公式可
.
,
厶
,
r
j、|
B
I
O
以表示如下:G=≠一=生且三{—一,其上h
2n‘m
∑∑ly;-yjI
工2
F
/
只
厶
/
中,ly;一yIl表示任何一对样本的收入差的绝对值,n是样本数量,队是收入均值。
二、基尼系数计算方法
现在,经济学家已经掌握了多种计算基尼系数的方法,例如:几何法(Geo-metricapproach)、基尼平均差法(Gini"s
/
o
/
A
/
圈2
只
Kendall和Stuart(1958年)在他们的(AdvancedTheoryofStatistics)一书中提出基尼系数等于基尼相对平均差的一半,这一个重要结论使基尼系数的计算方法又向前迈进了一步。基尼绝对平均
/
/
,/
//
//,//
◇
P
I
差(离散分布)表达式为:△:乓∑∑I
n
i=ij=1
A
./
B
//
o
/
Yl—yjl,连续分布表达式为:A=Elyi_yjl,其中ly;-yjl表示任何一对样本的收入差的绝对值,n是样本数量。基尼相对平均差
表达式为垒,所以基尼系数为:G=拿一=
ll,
‘“,
田1洛化兹一线
m艘llt
difference
approach)、协方差法
一
—1而广一一———i—一一
生!j!!
=竺i!!j!!
EElyi-yjl丁1∑∑max(O,y,-yj)
(Covarianceapproach)和矩阵法(Matrix
form
approach)。每一种方法都有它们各自的优点和适用范围,而且它们是相互统一和相互一致的。
(一)几何法
如果收入的分布为离散型分布,那么洛伦兹曲线以下部分即:B区域的面
-一l
(离散分布),G=舍=号篆吐=l—i1Jo!
Z也
Z“
啦7
(1一F劬)毡(连续分布)。
(三)协方差法
Stuart(1954)提出基尼绝对平均差可以表示为变量值yj和序号*(按收人大小从低到高排列,最贫穷的单位赋值为Ty=1,最富裕的单位赋值为*=N)的协方差的函数,但是把这个关系与计算基尼系数联系在一起还是由后来Anand提出的。
G=≠彳2A=2(}一B)=l-2B。当A--0时,
^十D
Z
积可以表示为:B=下1∑假+。棚ak。+u,
厶;=0
基尼系数为0,表示收入分配绝对平等;当B--O时,基尼系数为1,表示收入分配绝对不平等。基尼系数是0-1之间的数值,基尼系数越大,不均等程度越高;基尼系数越小,收入分配越平等。衡量收人差距的一般标准为:基尼系数在0.2以下表示高度平均;O.2-o.3之问表示相对平均;0.3-0.4之间表示较为合理;0.4—0.5之间表示差距偏大;0.5以上为差距悬殊。
(二)计算公式
根据新帕雷格拉夫经济学辞典,基尼系数的原始计算公式是:
n
其中P,是人口累积百分比,当收入Y=Yi的概率为皓上,则p产上;L是收入累积nn
离散分布:G:堡型趔是由
mu,
’
百分比,如果收入的平均数为u产上∑
II
i;l
Anand于1983年提出,因为i:上∑i:
ni=i
yi,那么【Fj一乞Yi。i为第i个样本,且
nuti}I
1’一
i=l'2,…n。所以基尼系数,G=I一乞a■一
i=0
,a一-I
半,cov(y一,)-}_y广里乒Il,,所以可
以写成G=丝盘盟:妻∑,,yl_
II
nuy
ut
i=1。
瑚(k-+U。
如果收入分布是连续型的,则B=
,I
r
型生,基尼系数为任意收入与其序号的协方差的函数。
连续分布:Lerman和Yitzhaki于1984年提出了关于连续分布的计算公
1
'1n’n
J
L(P)ltp,基尼系数=1—20
(二)基尼平均差法
J
12p)d9。
O
△=—≠—w三二lyi—yjI,0<A<20,
15
鼍甘鼻决簟
2004年第9期(总第177期)
式:因为在连续分布中基尼绝对平均差
rb
fb
有p(y.,1。)=l,O'y=bffry,
可以表达为:A=Ely.一Y,|_』
,l,
ly—xlf(x)f(y)
蝌慨:归≯
dxdy=2
F(x)【l—F(x)ldx,其中F为绝对
b
平均数的分布。经过部分积分和变量替
f
1
可舳,=旦案
、/IZ
(7)(8)
换后可以写成A=4
y(F(y)-丁1)f(y)dy,二
又。.¨=a+b彳y_a+b×旦争
由(7)、(8)联立可得
令f(y)dy=F(y),变积分区域【h,a】为【0,l】,
r
原式变为A=4
o¨
f.y(F)(F—i1)dF。F是一个
二
二
尘L:!篁塑:二!£塑互:
h
a+bx(N+1)/2
,——r一
h俪。
2v'x(a+b—N厂+I)
图3:Pen’sparade(列队分布)4
5
占占
乞E(gainIi—+j)pr(i—+j),pr(i--,j)=p.pj,己
J=l
i=1
在【o,l】之间的分布,其均值为_三一,所以
A--4cov(y,F(y))。由第二种方法定义基尼
系数G:叁…:地!(!必。
Z.Uy
Ily
Anand(1983)和Yitzhak(1984)用不
同的方法得到了一致的结果。协方差法已经被编写成程序,可以直接用统计软件包来计算基尼系数。
基于协方差法,下面介绍一种计算基尼系数的简单方法。
b何2vrr(a+b-N2丛)一b何一诉百
若令a显著小,则简化为:
鲤:
h
Pi=l,E是由Ei组成的kxk矩阵,E,,=E(gainli--*j);p=(pt,P2'…,曲7为由P.组成的kxl矩阵,m=(m.,m。…,mk)’为每一组收入的均值组成的kxl矩阵。所以m,p=
三
乞mip.=u,,P’EP为总的收入差距,基尼
i=1
2订(b掣一)VT(M)
、/丁(N+1)、/丁V
、/3
(9)
系数可表示为G=(m-p)。1P,EP。其中的E可以进行各种分解以得到我们所需分析的对象。由此看来,若要对基尼系数进行分解,则可以使用矩阵法。
三、结论1.第一种方法几何法简单明了,具有很强的直观性,除了本文中介绍的方法外,还有拟合曲线法,对洛伦茨曲线拟合曲线方程进而求得基尼系数;以及弓形面积法,根据弓形面积法的计算公式直接计算基尼系数。总的来说,用几何法计算基尼系数的精度比较低,只有通过细化分组来解决,分组越细,准确性越高,当组数趋于无穷大时,误差趋于零。
2.第二种方法基尼平均差法是协方差法的基础,虽然用这种方法计算基尼系数也很繁琐,但是它的思想和本质使得基尼系数不仅用于反映收入分配的不平等程度,还可以用于一切分配问题和均衡程度的分析,尤其可以用于描述财产、资本、资源、产品、市场等资源分配的均衡程度,大大地拓展了基尼系数本身的内涵。
3.协方差法是应用得最多,计算最简单的方法,由于它的优良品质,大部分统计软件以它的原理来编程-i十算基尼系数。
4.矩阵法为基尼系数的分解提供了便利,在计算出基尼系数值后,为了进一步研究收入分配差距的构成和成因,可以将基尼系数进一步分解。利用基尼系数分解法,分析各项收入来源在总收入中的份额、不均等程度及其对总差距的贡献;也可以利用此方法,分析收入差距的地区构成、行业构成和人员构成。基尼系数的分解方法属于前沿理论和方法,掌握矩阵法是把握基尼系数分解的前提。
(作者单位/中央财经大学经济学院,
上海金融学院)(责任编辑/李友平)
:义(坠!)(盥=!!:—L,/N-1一N+I一—b
联立(9)和(5):
c一%渺。
因为cov(yi,¨=q吖yp(yt,¨
㈩
(2)
仃,是个体收入标准差,盯ry是个体序号的标准差,p(y。,妨是Yi和Y,相关系数。
%:摩琴
型牡渊N
:盟f堕兰!)
G=击告洮m)鸨土=古×古×、/器、/孚=}
尘丛。上N3
结论:若Pen's
Parade为线性,基
尼系数=导(当N足够大)
初看此结论可能很奇怪,假如有2个这样的序列,(1,2,3,4,5)和(100,200,300,400,500),但这两个序列却具有相同的基尼系数值。这是因为尽管两者离散程度差异很大,但组(2)的每个数都是组(1)的100倍,也就是说组中的每个数与均值的相对程度是一样的,组(2)仅是组(1)按一定比例的扩大。
Parade在现实中是凸然而Pen"s的(见图3中的B曲线),即收入开始增长很慢,然后收入的绝对数逐渐增加,最
后收人增长速度也不断增快,B比A分配更加不公平。
(四)矩阵法
(3)
其中,∑fi-等!一).∑(i2-i(N+1)+
M蚤半)
Z
=删生6蜒№乳NN娅2IL+巡4盟
.‘.c:一2C矿ov(yi,1)一掣挚=
击昔毗1≯y骼
如果N足够大,型嚆』一一l:
(5)
q:、/亭
所以,盼击=-普p(‰训
(6)
矩阵法是Pyatt(1976)提出的,他定义基尼系数的表达式为两项的比率,即:
基尼系数可以分解为:常数X收入的标准差系数3×收入与序号的相关系数,or,斗yp都十分好计算,甚至可以手算得出结果。
假如Y和1有如下线性关系即列队分布曲线呈线形(见图3中的A直线),那么可以表示为:y=a+brv
G_{等。(a)gnl--T。;;荟m麟(o,yi一曲,称为
“平均收入差距”,如果每个个体可将他的收入与另一个体进行比较,当yi>yi时,则max(0,Y.一曲的值取Yi-yj,否则取零;㈣是收入的平均数U,。如果对人口分成K组,第i组人口占总人口比率为P。,
所以可以将平均收入差距定义为:乞
16
缝计与凌簟
三