14.03.2014 Views

JMP を用いた ARIMA モデルのあてはめ

JMP を用いた ARIMA モデルのあてはめ

JMP を用いた ARIMA モデルのあてはめ

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>JMP</strong> を 用 いた <strong>ARIMA</strong> モデルのあてはめ<br />

SAS Institute Japan 株 式 会 社 <strong>JMP</strong> ジャパン 事 業 部<br />

2013 年 2 月 作 成<br />

1.はじめに<br />

<strong>JMP</strong> の 時 系 列 分 析 では、 一 変 量 の 時 系 列 データに 対 する 分 析 や 予 測 を 行 うことができ、 時 系 列 データに 対 するグラフ 表 示 、 時 系<br />

列 モデルのあてはめ、モデルの 評 価 、 予 測 まで、 対 話 的 に 分 析 を 実 行 することができます。<br />

時 系 列 データにあてはめるモデルとしては、<strong>ARIMA</strong> モデルが 有 名 であり、 将 来 の 予 測 のために 広 く 用 いられています。しかし、<br />

<strong>ARIMA</strong> モデルでは、 自 己 回 帰 、 差 分 、 移 動 平 均 の 次 数 を 決 める 必 要 があり、 季 節 <strong>ARIMA</strong> モデルでは、これらの 次 数 に 加 え、 季 節<br />

周 期 を 決 めてモデルを 同 定 する 必 要 があります。<br />

<strong>JMP</strong> では、<strong>ARIMA</strong> モデル、 季 節 <strong>ARIMA</strong> モデルの 推 定 の 際 、 次 数 の 範 囲 を 指 定 して、 複 数 の <strong>ARIMA</strong> モデルをあてはめる 機 能 が<br />

あります。さらに、あてはめたモデルについては、AIC などの 適 合 度 基 準 によるモデルの 評 価 を 行 うことや、 残 差 のレポートにより、<br />

モデルが 適 切 かどうかの 判 断 を 行 うことができ、これらの 機 能 が、 複 数 の <strong>ARIMA</strong> モデル 間 での 適 合 度 の 比 較 、あてはめたモデル<br />

に 対 する 前 提 の 検 証 に 役 に 立 ちます。<br />

本 文 章 では、<strong>JMP</strong> を 用 いて、 時 系 列 データの 分 析 を 行 う 手 順 と、<strong>ARIMA</strong> モデル、 季 節 <strong>ARIMA</strong> モデルのあてはめ、 複 数 の <strong>ARIMA</strong><br />

モデルのあてはめと、モデルの 評 価 方 法 、 予 測 についてご 説 明 します。<br />

以 下 、<strong>ARIMA</strong> モデルについては、<strong>ARIMA</strong>(p,d,q) と 表 現 します。p、d、q はそれぞれ、 自 己 回 帰 の 次 数 、 差 分 の 次 数 、 移 動 平 均 の<br />

次 数 を 示 します。 季 節 <strong>ARIMA</strong> モデルについては、S<strong>ARIMA</strong>(p,d,q)(P,D,Q)s と 表 現 します。 P,D,Q はそれぞれ、 季 節 自 己 回 帰 の 次<br />

数 、 季 節 差 分 の 次 数 、 季 節 移 動 平 均 の 次 数 を 示 し、s は、1 季 節 の 期 数 ( 季 節 周 期 )を 示 します。<br />

複 数 の <strong>ARIMA</strong> モデルをあてはめる 機 能 は、<strong>JMP</strong> のバージョン 9 以 上 で 搭 載 されています。<br />

<strong>JMP</strong> の 時 系 列 分 析 で 選 択 できるオプションの 一 覧 を 示 します。オプションは、 時 系 列 分 析 レポートの 左 上 にある 赤 い 三 角 ボタンを<br />

クリックすることにより 選 択 することができます。<br />

1


2.「 時 系 列 分 析 」プラットフォームの 使 用 法<br />

<strong>JMP</strong> の「 時 系 列 分 析 」プラットフォームでは、 一 変 量 の 時 系 列 に 対 する 分 析 を 行 うことができます。この 章 では、<strong>JMP</strong> のサンプルデ<br />

ータを 用 いて、このプラットフォームの 使 用 法 をご 説 明 します。<br />

<strong>JMP</strong> のメニューバーより、[ヘルプ] > [サンプルデータ] を 選 択 しサンプルデータの 索 引 のウィンドウを 表 示 させ、[サンプルデータ<br />

ディレクトリ] ボタンをクリックします。 ファイルの 選 択 ウィンドウから、Time Series フォルダをクリックし、「Partial Size jmp 」( 粒 子<br />

のサイズ.jmp) を 開 きます。<br />

このデータは、 自 動 噴 霧 器 をテストするために、 噴 霧 剤 入 りのミニスプレードライヤーから 収 集 されたものです。 変 数 「 粒 子 のサイ<br />

ズ」には、 等 間 隔 の 時 間 で 測 定 された 粒 の 直 径 が 記 録 されています。<br />

<strong>JMP</strong> で 時 系 列 分 析 を 実 行 するには、メニューバーより、[ 分 析 ] > [モデル 化 ] > [ 時 系 列 分 析 ] を 選 択 します。 [Y, 時 系 列 ] に 列<br />

「 粒 子 のサイズ」 を 指 定 し、[OK] をクリックします。<br />

注 意 :<strong>JMP</strong> の 時 系 列 分 析 では、データは 時 間 に 従 って、 均 等 間 隔 に 並 んでいると 仮 定 して 分 析 を 行 います。 [X, 時 間 ID] には、<br />

X 軸 ( 時 間 軸 ) のラベルとなる 変 数 があれば 指 定 することができます。この 変 数 の 値 自 体 が 等 間 隔 でないときでも、 等 間 隔 とみ<br />

なして 分 析 が 行 われます。<br />

2


レポートとして、 折 れ 線 グラフや、 自 己 相 関 、 偏 自 己 相 関 の 数 値 、グラフが 表 示 されます。<br />

時 系 列 データでは、 折 れ 線 グラフにより、データの 傾 向 、 周 期 などを 確 認 します。いくつかの 山 や 谷 があり、 全 体 的 には、 若 干 の<br />

減 少 傾 向 がありそうです。<br />

折 れ 線 グラフの 下 側 に 表 示 される「 時 系 列 の 基 本 診 断 」のレポートには、 左 側 に 自 己 相 関 係 数 そのグラフ、 右 側 に 偏 自 己 相 関 係<br />

数 とそのグラフが 出 力 されます。 以 下 では、これらの 出 力 を 自 己 相 関 プロット、 偏 自 己 相 関 プロットと 呼 ぶことにします。<br />

自 己 相 関 係 数 は、 時 系 列 をある 期 数 だけずらし、 元 の 時 系 列 とずらした 時 系 列 との 相 関 係 数 を 求 めることにより 計 算 されます。ず<br />

らした 期 数 はラグと 呼 ばれ、 例 えば 1 期 ずらした 場 合 は、ラグが 1 の 行 の 自 己 相 関 係 数 (=0.9716)を 参 照 します。 グラフ 上 に 表 示<br />

される 水 色 の 曲 線 は、おおよその 95% 信 頼 区 間 を 示 します。<br />

このデータでは、 自 己 相 関 係 数 は 高 く、 系 列 間 に 相 関 があることがわかり、ラグが 大 きくなるについて、 自 己 相 関 係 数 は、 徐 々に<br />

小 さくなっています。<br />

偏 自 己 相 関 係 数 は、 各 ラグにおいて、そのラグよりも 期 数 が 小 さいラグから 受 ける 自 己 相 関 の 影 響 を 取 り 除 いた 上 で、 求 めた 相<br />

関 係 数 を 示 します。このデータでは、ラグが 1 のときの 偏 自 己 相 関 係 数 が 0.9716 と 突 出 しています。<br />

自 己 相 関 プロットと 偏 自 己 相 関 プロットは、<strong>ARIMA</strong> モデルの 自 己 回 帰 次 数 、 移 動 平 均 次 数 を 決 める 際 のヒントになります。<br />

偏 自 己 相 関 プロットでは、ラグ 1 の 値 が 突 出 していますが、ラグ 2 やラグ 3 でも 信 頼 区 間 の 外 にあることから、AR( 自 己 回 帰 )の 次<br />

数 として、1、2 または 3 であると 考 えられます。 自 己 相 関 プロットでは、 突 出 している 値 はなく、 徐 々に 減 少 しているため、ここでは、<br />

MA( 移 動 平 均 )の 次 数 は 0 とします。<br />

まず、 最 初 に AR(1) (= <strong>ARIMA</strong>(1,0,0) ) をあてはめてみます。<br />

3


レポート「 時 系 列 粒 子 のサイズ」 の 左 上 にある 赤 い 三 角 ボタンより、[<strong>ARIMA</strong>] を 選 択 します。 「<strong>ARIMA</strong> モデルの 指 定 」のダイア<br />

ログボックスにおいて、「 自 己 回 帰 次 数 」 の 値 を 1 として、[ 推 定 ] ボタンをクリックします。<br />

レポート 下 側 に、「モデルの 比 較 」のレポートと、「モデル: AR(1) 」 のレポートが 追 加 されます。<br />

「モデル: AR(1) 」のレポートを 参 照 します。<br />

「モデルの 要 約 」 には、あてはめたモデルに 対 する 適 合 度 統 計 量 が 表 示 されます。 レポートにある「 赤 池 の 情 報 量 基 準 」(AIC)<br />

や SBC は、 良 くあてはまっているほど、 値 が 小 さくなる 基 準 です。 後 述 するモデルの 比 較 の 際 に 用 います。<br />

「パラメータ 推 定 値 」は、AR モデルにおけるパラメータの 推 定 値 、 標 準 誤 差 、 係 数 に 対 する 有 意 差 検 定 の 結 果 が 出 力 されます。<br />

<strong>JMP</strong> では、 最 尤 法 によって <strong>ARIMA</strong> モデルのパラメータを 推 定 しています。<br />

あてはめたモデルに 対 する、「 予 測 」のグラフが 表 示 されます。<br />

4


このグラフでは、モデルによる 予 測 値 を 折 れ 線 グラフで 表 示 しています。 横 軸 が 559(= データ 数 )の 青 い 垂 線 より 左 側 の 領 域 で<br />

は、 実 測 値 のプロットと 予 測 値 を 比 較 することができます。 右 側 の 領 域 は、 将 来 の 予 測 値 とその 95% 信 頼 区 間 が 表 示 されます。<br />

AR(1) モデルをあてはめた 場 合 、559 時 点 より 先 の 直 近 の 予 測 値 は、 上 昇 傾 向 にあることがわかります。<br />

「 予 測 」のレポートには、「 残 差 」のレポートがあり、 左 側 の 三 角 ボタンをクリックすると 開 くことができます。 上 側 にはモデルをあて<br />

はめたときの 残 差 プロット、 下 側 には、 残 差 の 自 己 相 関 プロット、 偏 自 己 相 関 プロットが 表 示 されます。<br />

<strong>ARIMA</strong> モデルにおいて、 残 差 は 0 を 中 心 に 正 規 分 布 に 従 い、かつ 自 己 相 関 や 偏 自 己 相 関 がゼロである、いわゆるホワイトノイズ<br />

であることが 望 ましいとされます。<br />

残 差 の 自 己 相 関 プロット、 偏 自 己 相 関 プロットをみると、ともにラグ 1 での 自 己 相 関 、 偏 自 己 相 関 が 大 きくなっているため、あては<br />

めたモデルが 適 切 でない 可 能 性 があります。<br />

自 己 相 関 プロットの 右 側 には、Ljung-Box Q 統 計 量 と 統 計 量 に 対 する p 値 が 表 示 されます。 各 ラグにおける Ljung-Box Q 統 計 量<br />

は、 先 頭 (ラグ 1)から 該 当 のラグまでの 複 数 の 自 己 相 関 がすべて 0 であるという 帰 無 仮 説 を 検 定 し、 帰 無 仮 説 が 棄 却 されると、 少<br />

なく 1 つの 自 己 相 関 係 数 が 0 と 有 意 に 異 なる 結 論 できます。この 検 定 は、 時 系 列 がホワイトノイズであるかどうかを 判 定 する 方 法<br />

として 用 いられます。この 例 では、すべてのラグで、 高 度 に 有 意 のため、その 時 系 列 はホワイトノイズではないと 判 断 されます。<br />

同 様 に [<strong>ARIMA</strong>] のオプションを 選 択 することにより、 AR(2)、AR(3) のモデルをあてはめてみます。<br />

「モデルの 比 較 」のレポートには、AR(1) に 加 え、AR(2)、AR(3) のレポートも 追 加 されます。 レポートでは、モデルごとの 適 合 度<br />

統 計 量 がまとめられ、さまざまなモデルを 比 較 することができます。モデルは、AIC の 小 さい 順 、すなわち、AIC の 基 準 による 適 合<br />

度 が 良 い 順 に 上 から 下 へ 並 べられます。<br />

5


レポートでは、AR(3)、AR(2)、AR(1) の 順 に 並 んでいますので、このモデルの 中 では、AR(3) が 最 も 適 合 しているモデルということ<br />

になります。 さらに、 各 モデルの「グラフ」のチェックをいれると、 右 側 のグラフに、あてはめたモデルを 表 示 、 残 差 の 自 己 相 関 プ<br />

ロット( 残 差 ACF)、 残 差 の 偏 自 己 相 関 プロット( 残 差 PACF)が 表 示 されます。<br />

AR(3) の 残 差 レポートを 参 照 してみます。<br />

ラグ 1 以 降 の 自 己 相 関 、 偏 自 己 相 関 ともに 小 さく、Ljung-Box Q 統 計 量 による 検 定 の p 値 も、 有 意 でない 箇 所 が 多 くなっていま<br />

す。<br />

以 上 の 分 析 、 考 察 より、モデルとして AR(3) を 採 用 することにします。<br />

6


予 測 する 期 数 は、レポート「 時 系 列 粒 子 のサイズ」の 左 上 の 三 角 ボタンをクリックして、[ 予 測 する 期 数 ] オプションを 選 択 し、 予<br />

測 したい 期 数 を 入 力 することにより 変 更 することができます。AR(3) のあてはめの「 予 測 」、 予 測 する 期 数 を 100 に 指 定 したときの<br />

グラフを 以 下 に 示 します。<br />

AR(3) の「 予 測 」プロットでも、データ 数 である 559 時 点 より 先 の 予 測 値 は、 上 昇 傾 向 にあることがわかります。<br />

実 際 の 予 測 値 、その 信 頼 区 間 の 値 を 調 べたい 場 合 は、レポート「モデル: AR(3)」 の 左 上 にある 赤 い 三 角 ボタンより、[ 列 の 保 存 ]、<br />

または [ 予 測 式 の 保 存 ] を 選 択 することにより、 予 測 値 やその 信 頼 区 間 をまとめたデータテーブルを 出 力 することができます。<br />

実 際 の 予 測 値 や 信 頼 区 間 を 数 値 として 確 認 したい 場 合 は、このデータテーブルの 数 値 を 参 照 します。<br />

この 章 では、<strong>ARIMA</strong> のあてはめについて 説 明 しましたが、[ 季 節 <strong>ARIMA</strong>] オプションを 選 択 することにより、 季 節 <strong>ARIMA</strong> モデルも<br />

あてはめることができます。<br />

7


3. 複 数 の <strong>ARIMA</strong> モデルを 一 度 にあてはめ<br />

<strong>ARIMA</strong> モデルでは、<strong>ARIMA</strong>(p,d,q) の 次 数 を、 季 節 <strong>ARIMA</strong> モデルでは、S<strong>ARIMA</strong>(p,d,q)(P,D,Q)s の 次 数 、 期 数 を 決 める 必 要 があり<br />

ます。これらの 次 数 、 期 数 は、 自 己 相 関 プロットや 偏 自 己 相 関 プロットや、データの 差 分 をとることにより 推 測 することができます<br />

が、 明 確 に 決 めることはできないことがあります。このとき、 例 えば 自 己 回 帰 の 次 数 p は 0 から 2 の 範 囲 であると 考 えられるので<br />

あれば、これらの 範 囲 を 指 定 して、 範 囲 内 のすべてのモデルをあてはめ、 適 合 度 統 計 量 を 確 認 して、モデルの 優 先 順 位 を 決 定 す<br />

る 方 法 が 考 えられます。<br />

<strong>JMP</strong> では、 次 数 の 範 囲 を 指 定 して、 複 数 の <strong>ARIMA</strong> モデルをあてはめる 機 能 がありますので、 本 章 では、この 機 能 を 用 い、 時 系 列<br />

データに 対 して、<strong>ARIMA</strong> モデル、 季 節 <strong>ARIMA</strong> モデルをあてはめてみます。<br />

<strong>JMP</strong> のサンプルデータとして、2 章 と 同 様 のフォルダから、「Lead Production.jmp」 (「 鉛 の 生 産 高 .jmp」) を 開 きます。<br />

このデータは、1986 年 1 月 から 1992 年 9 月 まで、 月 ごとの 鉛 の 生 産 高 を 記 録 しています。 時 系 列 分 析 のプラットフォームを 用 い<br />

て 分 析 してみますが、 分 析 の 前 に、 列 「 日 付 」 を 選 択 し、[ 列 ] > [ラベルあり/ラベルなし] を 選 択 することにより、ラベルをつけて<br />

おきます。<br />

時 系 列 分 析 のプラットフォームを 起 動 し、 次 のように 列 を 指 定 して [OK] をクリックします。<br />

8


時 系 列 グラフが 出 力 されます。<br />

1986 年 や 1988 年 の 鉛 の 生 産 高 は、 変 動 が 大 きいことがわかります。 興 味 があるプロットを 右 クリックし、[ 行 ラベル] を 選 択 すると、<br />

データテーブルで 指 定 したラベルが 表 示 されます。<br />

自 己 相 関 プロット、 偏 自 己 相 関 プロットが 出 力 されます。<br />

偏 自 己 相 関 プロットでは、ラグが 1 のときの 偏 自 己 相 関 が 突 出 していて、ラグ 2 以 降 の 偏 自 己 相 関 は、ほぼ 信 頼 区 間 内 にありま<br />

す。そのため 自 己 回 帰 の 次 数 p の 候 補 は、1 になります。<br />

自 己 相 関 プロットをみると、ラグ 1、ラグ 2、ラグ 3 と 徐 々に 自 己 相 関 は 小 さくなり、ラグが 4 のときに 自 己 相 関 は 0 に 近 くなっていま<br />

す。また、 信 頼 区 間 より 外 にある 自 己 相 関 は、ラグ 1、ラグ 2 のときのため、 移 動 平 均 の 次 数 q の 候 補 は 1 または 2 とします。 差<br />

分 の 次 数 d については、0 から 2 の 範 囲 で 検 討 してみます。<br />

9


さらに 自 己 相 関 プロットでは、ラグ 6 やラグ 12 で 値 が 大 きくなっています。このことから、データに 半 年 または 年 周 期 の 要 素 がある<br />

ことが 考 えられます。このグラフから 季 節 性 の 次 数 については、 判 断 しにくいため、 季 節 自 己 回 帰 、 季 節 差 分 、 季 節 移 動 平 均 のそ<br />

れぞれの 次 数 (P,Q,R)の 範 囲 を 0 から 2 の 間 に 設 定 し、 季 節 周 期 (s)を 6 または 12 に 設 定 して、 複 数 の <strong>ARIMA</strong> モデルをあてはめ<br />

てみます。<br />

レポート「 時 系 列 鉛 の 生 産 高 」の 左 上 にある 赤 い 三 角 ボタンをクリックし、[ 複 数 の <strong>ARIMA</strong> モデル] を 選 択 します。<strong>ARIMA</strong> モデル<br />

の 次 数 や 期 数 を 指 定 するダイアログボックスが 表 示 されますので、ここに 次 数 や 期 数 の 範 囲 を 指 定 します。<br />

まずは、 半 年 周 期 であると 仮 定 し、「 季 節 あたりの 期 間 数 」には 6 を 指 定 します。<br />

ダイアログ 下 には、モデルの 総 数 162 と 表 示 され、162 個 の <strong>ARIMA</strong> モデルをあてはめることを 示 しています。<br />

[ 推 定 ] ボタンをクリックすると、162 個 の <strong>ARIMA</strong> モデルの 推 定 が 行 われます。<br />

注 意 : 複 数 の <strong>ARIMA</strong> モデルのあてはめは、たくさんのモデルをあてはめると、より 多 くのメモリを 消 費 します。<br />

「モデルの 比 較 」のレポートには、162 個 のあてはめに 対 する 適 合 度 統 計 量 が 表 示 されます。2 章 で 記 載 したとおり、AIC の 値 が 小<br />

さい 順 に 並 びます。レポートより、162 個 のあてはめの 中 で、 最 も 良 いモデルは、S<strong>ARIMA</strong>(1,2,2,)(2,2,2) 6 であることがわかりま<br />

す。<br />

さらに、[ 複 数 の <strong>ARIMA</strong>] のオプションを 用 いて、 期 数 を 12(1 年 周 期 )に 設 定 し、 他 の 次 数 の 範 囲 は 同 様 の 設 定 にして、 複 数 の<br />

<strong>ARIMA</strong> モデルを 推 定 してみます。<br />

10


「モデルの 比 較 」のレポートには、 期 数 が 6 のときの 結 果 と、 期 数 が 12 のときの 結 果 がまとめて 表 示 されます。そのため、 期 数 が<br />

6 のときの 162 個 のモデル、 期 数 が 12 のときの 162 個 のモデルの 計 324 個 のモデルに 対 する、 適 合 度 統 計 量 が 出 力 されていま<br />

す。<br />

注 意 :あてはめるモデルの 総 数 が 多 いと、それだけ 多 くのメモリを 消 費 します。そのため、 多 くのモデルをあてはめるとメモリが 不<br />

足 する 可 能 性 もあります。<br />

モデルの 上 位 には、 期 数 が 12 のモデルが 多 く 含 まれています。 最 良 のモデルは、S<strong>ARIMA</strong>(1,2,2)(0,2,2) 12 です。このモデルのグ<br />

ラフとレポートを 表 示 させるために、 左 側 のチェックボックスにチェックをいれています。 右 側 のグラフは、このモデルをあてはめた<br />

ときの 予 測 値 と 信 頼 区 間 、 残 差 ACF( 残 差 自 己 相 関 係 数 )、 残 差 PACF( 残 差 偏 自 己 相 関 係 数 ) を 表 示 しています。 将 来 の 予 測<br />

値 は、 上 下 に 変 動 しますが、 長 期 的 には 増 加 傾 向 になるようです。<br />

11


S<strong>ARIMA</strong>(1,2,2)(0,2,2) 12 の「 残 差 」のレポートを 確 認 してみます。<br />

下 図 の 残 差 プロットでは、Y 軸 をダブルクリックし、0 に 参 照 線 を 引 いています。<br />

残 差 (の 絶 対 値 )が 大 きいプロットがいくつか 見 られますが、 多 くのデータが 0 を 中 心 にランダムにばらついているようです。<br />

残 差 の 自 己 相 関 プロット、 偏 自 己 相 関 プロットを 参 照 してみます。<br />

いくつかのラグ 値 で 自 己 相 関 や 偏 自 己 相 関 が 高 いところが 見 られますが、Ljung-Box Q 検 定 による p 値 は、すべでのラグで 有 意<br />

水 準 である 0.05 より 大 きくなっています。そのため、 残 差 にはホワイトノイズの 特 徴 が 見 てとれます。<br />

このように、<strong>JMP</strong> では、 複 数 の <strong>ARIMA</strong> モデルを 一 度 にあてはめを 行 い、モデルの 評 価 、 検 証 を 行 うことができます。<br />

12

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!