【FX機械学習】分類モデルにおけるシーケンス長の最適値を調べてみた

FXの値動きをAIで分類（BUY・SELL・HOLD など）するとき、
「過去何本のデータをモデルに入力すれば一番うまく予測できるのか？」
という疑問は、誰もが一度は考えます。

今回は、実際にシーケンス長（過去データの本数）を変えながら、
F1 Macro（クラスの平均的な予測精度） がどのように変化するか調べてみました。

シーケンス長とは？

AIモデルに入力する「過去データの長さ」です。

長くすると「より多くの情報」が入りますが、
その分だけノイズも増えるため、精度が下がることもあります。

AIが使う特徴量やモデル構造は同じで、
シーケンス長だけを変えて比較しました。

下のグラフが今回の結果です。

縦軸：F1 Macro 平均
横軸：シーケンス長

グラフを見ると…

このあたりで F1 Macro ≈ 0.52 と、最も高い値になりました。

つまり、

短すぎると情報が足りず、
長すぎるとノイズが増えてしまう。
その中間が一番うまくいく。

という、直感的にも納得しやすい結果でした。

シーケンスが長くなるほど、モデルは…

といった問題が起きやすくなります。

FXはとくに

短期ほどランダムノイズが多く、
長期ほど“相場状態が変わってしまう”

ため、「中間の長さ」を選ぶことが重要になります。

今回の実験結果から、分類モデルにおいては…

もっとも安定して高い精度

そこそこ良い。
軽量モデルを作りたいときに適切。

情報が多すぎて逆に精度が下がりやすい。

という傾向が見られました。

今回の検証では、

FXの分類タスクでは、シーケンス長は50〜70本が最適

という結果になりました。

もちろん、使う特徴量・モデル・通貨ペアによって変わるため、
あなたの環境でもぜひ同じように比較してみることをおすすめします。

この記事が、FXのAIモデル設計の参考になればうれしいです。

こちらのコミュニティで、AIや機械学習をトレードに活かすために日々探求しています。
興味のある方は覗いてみてください。