一覧へ戻る
Discussion Paper Discussion Paper 148 (2018.12)

[No.148] Boundary problem and data leakage: A caveat for wavelet-based forecasting

蓮見 亮
  特任研究員
梶田 脩斗
   

2018/12/03

近年、機械学習モデルの経済予測への応用が注目を集めている。機械学習モデルを利用した予測には、データから特徴量を抽出する作業が必要になる。経済時系列データの特徴量抽出には、しばしばウェーブレット変換が用いられてきた。いくつかの既存研究によると、ウェーブレット変換と機械学習モデルを組み合わせた予測モデルは、伝統的な時系列モデルの予測精度を大きく上回るという。しかし、これらの研究は必ずしも経済時系列データの加工方法について十分な情報を明らかにしておらず、予測結果が頑健でない可能性がある。

本稿では、経済時系列データを不適切な方法でウェーブレット変換した場合、予測時点では本来未知であるはずの将来のデータを使用して予測する「データ漏洩」が発生し、見かけ上予測モデルの精度を劇的に向上させてしまう場合があることを示す。我々の分析例では、「データ漏洩」が起こらないように適切に経済時系列データをウェーブレット変換した場合、予測モデルの精度は原系列のナイーブ予測(前期の値を予測値とすること)すら超えることができない。ウェーブレット変換を使用した予測モデルの再現性の確保には、データの加工方法に関する詳細な説明が不可欠である。

※旧サイト(~2018.8月)のDiscussion Paper一覧はこちらから

バックナンバー

2023/02/22

[No.157] 株価・物価を動かす経済ニュース指標
―日経・UTEcon日次景気指数による分析―

宮﨑 孝史下田 吉輝 小野寺 敬

2022/12/29

[No.156] 平均的な外出のコロナ感染リスクは限定的

高久 玲音 一橋大学准教授 / 田原 健吾 / 北爪 匡 日本経済新聞社 編集 データジャーナリスト / 田淵貴大 大阪国際がんセンター 大竹文雄 大阪大学特任教授、日本経済研究センター研究顧問

2022/09/21

[No.155] QQE下における日本銀行のETF買い入れ

左三川(笛田) 郁子

2022/05/30

[No.154] ESG Management and Credit Risk Premia: Evidence from Credit Default Swaps for Japan’s Major Companies

稲葉 圭一郎 畠山 雄史 三井住友DSアセットマネジメント(株)運用部 兼 責任投資推進室 シニアマネージャー

2021/08/24

[No.153] Comparing the Earned Income Tax Credit and Universal Basic Income in a Heterogeneous Agent Model

蓮見 亮 高野 哲彰