いっかくのデータサイエンティストをいく

1からプログラミングとデータサイエンスを独習したい

【統計学】回帰分析と最小二乗法(理論編その2)

前回の続きです。今回は実際に残差平方和を最小にして傾きを求めます。

残差を最小にする

前回の復習で、残差平方和は以下のようになりました。

f:id:imakoto0323:20180613115235p:plain

こちらを最小となるようにbを求めます。なお、残差二乗和を最小とするので、最小二乗法といいます。

正規方程式

残差二乗和を最小とするためには2乗してそれが0になればOKです。 まずaを偏微分すると

f:id:imakoto0323:20180613115304p:plain

次にbを偏微分すると

f:id:imakoto0323:20180613115320p:plain

算出された(1)(2)の式を正規方程式といいます。

回帰係数の導出

(1)式の両辺をnで割ります。

f:id:imakoto0323:20180613115013p:plain

ここで、

f:id:imakoto0323:20180613115053p:plain

となり、\displaystyle y\displaystyle xそれぞれの平均となります。 つまり

f:id:imakoto0323:20180613115707p:plain

これを(2)に代入します。

f:id:imakoto0323:20180613115842p:plain

これで一応導出できました。

回帰係数を式変形してみる

上の回帰係数の式を変形すると

f:id:imakoto0323:20180613135815p:plain

となり、

f:id:imakoto0323:20180613140117p:plain

というきれいな形になっています。

最小二乗回帰式の性質

  • x、yの平均(\displaystyle \bar{y}, \displaystyle \bar{y})を通ります。
  • 残差と合計は0です。 \sum_{i=1}^{n}   { e_i }=0
  • 残差と説明変数の積は0です \sum_{i=1}^{n}   {{ e_i } { x_i }}=0
  • 説明変数と残差は直交しています。

次回は回帰分析の結果を見るための理論です。