いっかくのデータサイエンティストをいく

1からプログラミングとデータサイエンスを独習したい

【時系列】ARIMA(Python)

時系列データをPythonで扱うのって難しく感じるのは私だけですかねえ。

ARIMAモデル

statsmodelsのarima_modelでできます。データは2015年1月から2018年7月までの日経225データです。

import pandas as pd
import numpy as np
from statsmodels.tsa import arima_model
import matplotlib.pyplot as plt

#データ
nikkei225 = pd.read_csv('C:\\Users\\USER\\Documents\\R\\nikkei225.csv', engine='python')
data = np.array(nikkei225['終値'])

#ARIMA
results = arima_model.ARIMA(data,order = [1,1,1]).fit()

#図と予測
plt.clf()
plt.plot(data)
plt.plot(results.predict(start=0,end=50))
plt.legend(['data','predicted'])

f:id:imakoto0323:20180709134616p:plain

参考

qiita.com

qiita.com