いっかくのデータサイエンティストをいく

1からプログラミングとデータサイエンスを独習したい

【時系列】ARIMA(理論編)

沖本本では2章でARMAまで説明しているのにARIMAは第5章まで待たないといけません。

本当は単位根とか説明しないといけないのかもしれませんが先に記事にしたいと思います。 というのもこのARIMAモデルはビジネスの場面で本当によく見かけるからです。

今回は以下の本も参考にしてます。

時系列データの基本構造

時系列データ =短期の自己相関 +周期的変動 +トレンド +外因性 +ホワイトノイズ という基本構造で時系列データはできています。 これらの問題に 周期的変動・・・ARMA成分 周期的変動・・・季節成分 トレンド・・・差分をとることで消す 外因性・・・ARIMAXモデル で対応できます。

ARMAモデル

ARMA(自己回帰移動平均)はARモデルとMAモデルを組み合わせたモデルで自己回帰を柔軟に表現できるものでした。

f:id:imakoto0323:20180709124000p:plain

ただし、ARMAモデルは非定常過程には用いることができません。

和分過程(単位根過程)

原系列が非定常過程でも差分過程は定常過程になる場合があります。そのような過程を和分過程(単位根過程)といいます。

d期先との差分をとる和分過程をd階の和分過程といいます。

ARIMA(自己回帰和分移動平均)モデル

ARMAモデルでは非定常過程に対して利用できません。しかし和分過程に対しては差分をとって定常過程に変換してARMAモデルを利用できます。

差分をとってARMAモデルを利用するモデルをARIMAモデルといいいます。 p次先のARモデル、d階の和分過程、q次のMAモデルを合わせたARIMAモデルをARIMA(p,d,q)と表します。

SARIMA*1モデル

通常のARIMAモデルはとなりまたは数期前のデータと差分をとります。しかし季節変動がある場合にその影響を考えるために季節階差をとります。これをSARIMA(季節性ARIMA)モデルといいます。

例えば12か月周期で考えた場合、「先月も高ければ今月も高いだろう」と通常のARIMAモデルでは前月と当月との自己相関をモデル化します。 f:id:imakoto0323:20180709163701p:plain

しかしSARIMAモデルでは「1月は毎年高いだろう」と毎年同じ月の自己相関をモデル化します。 f:id:imakoto0323:20180709164136p:plain

ARIMAXモデル

ARIMAモデルに外生変数を加えた形のモデルをARIMAXモデルといいます。 外生変数にはイベントや曜日等を入れることができます。

*1:「えすありま」と読む人も「さりま」と読む人もしっているのですがどちらが正解なんでしょうか