いっかくのデータサイエンティストをいく

1からプログラミングとデータサイエンスを独習したい

【経済学】ローレンツ曲線とジニ係数(理論編)

有斐閣統計学」は経済学系の書籍なので、経済学の計算が登場します。今回はローレンツ曲線とジニ係数を考えます。 出典は有斐閣統計学」第1章SECTION6です。

ローレンツ曲線

  • ローレンツ曲線:所得、人口、販売高などの一定のグループへの集中の度合いを観察できる曲線です。簡単に言うと一極集中しているか否か観察できます。

今回は所得所得分配にかんするローレンツ曲線を考えます。 所得に関するローレンツ曲線は所得分配線と呼ばれています。

ローレンツ曲線を描く

ローレンツ曲線を描くには「累積相対所得」が必要です。

  • 「累積所得」:「所得」の累積額
  • 「累積相対所得」:所得の合計に対する累積所得の比率。例えば下から30%に属する人の所得の合計が全体の所得の20%の場合累積相対所得が10%となります(ちなみに後述の累積相対度数は30%)。

横軸に累積相対度数(0~100%)、縦軸に累積相対所得をとり、各店をプロットして線で結んだものがローレンツ曲線となります。

ジニ係数

ローレンツ曲線と45度線で囲まれた面積をジニ係数といいます。

ジニ係数には  0≦ジニ係数≦1 の性質があり、 0に近い→平等 1に近い→不平等 となっています。

図解

ローレンツ曲線とジニ係数を図示すると下のようになります。 *2 f:id:imakoto0323:20180610202314p:plain 45度線は、それにローレンツ曲線が重なると完全平等なので完全平等線と呼ばれています。

あとで実装していきます。

*1:なぜ2をかけるのかわかりません。。。

*2:多分ジニ係数の表記は違うと思います。本来は面積の2倍なので。