いっかくのデータサイエンティストをいく

1からプログラミングとデータサイエンスを独習したい

【時系列】差分系列と単位根検定

沖本本5章から。

差分系列

非定常なデータは時間によって期待値が変化するため予測ができません。 しかし、非定常なデータでも差分をとることによって定常になることがあります。これを差分系列と呼びます。差分をとることはよくやることで一見分析ができないものでも分析ができるようになります。 f:id:imakoto0323:20181204124025p:plain

単位根と見せかけの回帰

差分をとった場合、原系列では非定常だったデータが定常になる場合があります。これを単位根過程といいます。

単位根過程で何が困るのかというと、時系列データの回帰分析をする場合です。時系列データを回帰する場合、本来は因果関係のないデータ同士でも因果関係があるかのように検出されます。これを見せかけの回帰といいます。 なぜそうなるかというと、上昇、下降が1/2の確率で発生すると(上昇、上昇)(下降、下降)が何回か重なって発生するためかなと個人的には思っています。

Rで実装

library(tseries)
x <- rnorm(1000)  # サンプルとして定常過程を使う
adf.test(x)
> Augmented Dickey-Fuller Test

data:  x
Dickey-Fuller = -8.7153, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary
# 帰無仮説が棄却された、すなわちこれは定常過程という判定


y <- diffinv(x) # 単位根を含むように変えてみた
adf.test(y)

Augmented Dickey-Fuller Test

data:  y
Dickey-Fuller = -3.121, Lag order = 9, p-value = 0.1038
alternative hypothesis: stationary
# 帰無仮説が採択された、すなわちこれは単位根過程