一覧へ戻る
Discussion Paper Discussion Paper 148
(2018.12)
[No.148] Boundary problem and data leakage: A caveat for wavelet-based forecasting
2018/12/03
近年、機械学習モデルの経済予測への応用が注目を集めている。機械学習モデルを利用した予測には、データから特徴量を抽出する作業が必要になる。経済時系列データの特徴量抽出には、しばしばウェーブレット変換が用いられてきた。いくつかの既存研究によると、ウェーブレット変換と機械学習モデルを組み合わせた予測モデルは、伝統的な時系列モデルの予測精度を大きく上回るという。しかし、これらの研究は必ずしも経済時系列データの加工方法について十分な情報を明らかにしておらず、予測結果が頑健でない可能性がある。
本稿では、経済時系列データを不適切な方法でウェーブレット変換した場合、予測時点では本来未知であるはずの将来のデータを使用して予測する「データ漏洩」が発生し、見かけ上予測モデルの精度を劇的に向上させてしまう場合があることを示す。我々の分析例では、「データ漏洩」が起こらないように適切に経済時系列データをウェーブレット変換した場合、予測モデルの精度は原系列のナイーブ予測(前期の値を予測値とすること)すら超えることができない。ウェーブレット変換を使用した予測モデルの再現性の確保には、データの加工方法に関する詳細な説明が不可欠である。
※旧サイト(~2018.8月)のDiscussion Paper一覧はこちらから
バックナンバー
- 2023/02/22
-
[No.157] 株価・物価を動かす経済ニュース指標
―日経・UTEcon日次景気指数による分析― - 2022/12/29
-
[No.156] 平均的な外出のコロナ感染リスクは限定的
- 2022/09/21
-
[No.155] QQE下における日本銀行のETF買い入れ
- 2022/05/30
-
[No.154] ESG Management and Credit Risk Premia: Evidence from Credit Default Swaps for Japan’s Major Companies
- 2021/08/24
-
[No.153] Comparing the Earned Income Tax Credit and Universal Basic Income in a Heterogeneous Agent Model