AIモデルは“何を学んでいる”のか?FXトレードにおける特徴量設計のすべて

特徴量とは?AIトレードの“インプット設計”の基礎知識

AIを用いたトレード戦略の設計で避けて通れないのが「特徴量(Feature)」の選定です。これは、AIモデルが“何をもとに判断するか”という、いわば「考えるための材料」に相当します。

トレードの世界では、ローソク足の価格情報や出来高、インジケーターの値など、時系列データが大量に存在しますが、これらをそのまま学習に使うのではなく、目的に応じて要素を抽出・加工したものが特徴量です。

たとえば、以下のようなものが典型的な特徴量です:

  • 過去N本の移動平均(SMA、EMAなど)
  • ボラティリティ指標(ATR、標準偏差など)
  • テクニカルインジケーター(RSI、MACD、CCI)
  • ローソク足の形状(ヒゲの長さ、陽線率など)
  • 時刻や曜日(時間帯による市場の特徴を反映)

なぜ特徴量設計が重要かというと、AIは“入力されたものしか判断できない”ためです。価格そのものはAIにとって単なる数字であり、それをどう料理して「意味ある判断材料」にするかは、トレーダーの腕にかかっているのです。

トレードに使える“特徴量の種類”と使い分けのヒント

ここからは、AIトレードにおける代表的な特徴量をカテゴリ別に紹介し、それぞれの意味や注意点を解説します。

価格系特徴量

代表例:直近の終値・高値・安値・始値、移動平均、リターン(変化率)

  • 時系列として最も基本的なデータ。価格の推移からトレンドや反転を読み取る際に使われる。
  • 単体ではあまり意味を持たないため、「前日比」「5本平均との乖離」などの変化を捉える加工が必要。

テクニカル指標ベースの特徴量

代表例:RSI、MACD、ストキャスティクス、ボリンジャーバンド、CCIなど

  • 市場の勢いや反転ポイントを定量的に捉えることが可能。
  • パラメータ次第で大きく挙動が変わるため、複数の期間・閾値を試して有効性を比較する必要がある。

ボラティリティ・変動幅系

代表例:ATR、標準偏差、価格レンジ、ピボットポイント

  • 相場の荒れ具合を示す指標として、リスク管理やポジション調整に活用できる。
  • 特にスキャルピング戦略では、この情報が重要な役割を果たす。

時間・環境情報

代表例:時間帯(東京/ロンドン/NY)、曜日、指標発表の有無、祝祭日フラグ

  • 市場の動きは時間帯によって傾向が異なるため、有効な補助情報になる。
  • 曜日や時間ごとに勝率が変わるケースも多く、軽視できない。

自作ルールベースの変数

代表例:前回のエントリーからの経過時間、勝敗履歴、連勝・連敗数など

  • 機械学習では「直近の状況」や「取引履歴」による心理的・連動的な動きを反映することが可能。
  • 一方で、過学習のリスクもあるため、慎重な設計が必要。

次の後編では、これらの特徴量をどう選び、どう組み合わせ、どう評価していくかという“実践フェーズ”に移っていきます。

特徴量の選び方と評価軸:重要なのは「意味のある差を捉えること」

前編では、AIトレードにおける特徴量の種類を中心に紹介しました。ここからは、実際にモデルに使う特徴量をどう選ぶか、どんな評価軸で効果を測るかを具体的に見ていきましょう。

まず大前提として、「特徴量は多ければよい」というものではありません。無関係な情報やノイズを多く含むと、モデルは“本質的でないパターン”に反応してしまい、いわゆる過学習(オーバーフィッティング)のリスクが高まります。

効果的な特徴量選定のポイントは次の3つです:

  • 分布に違いがあるか(クラスごとに明確な差があるか)
  • 過去のトレード結果やラベルと相関があるか
  • 将来にわたって再現性・安定性があるか(使いまわし可能か)

また、モデル構築においては「特徴量重要度(Feature Importance)」の確認も重要です。ランダムフォレストやXGBoostのようなモデルでは、各特徴量が予測に与える影響の度合いを可視化できます。

特徴量エンジニアリングの実践例とテクニック

実際のトレードAI構築では、既存のインジケーターだけでなく、自分で考案した特徴量を作る「特徴量エンジニアリング」が勝負の分かれ目です。以下は実際によく使われる応用的な加工手法です。

平滑化(スムージング)

  • ノイズを減らして全体の傾向をつかみやすくする。
  • 例:5期間のSMA、EWMAなど。

正規化・標準化

  • 各変数のスケールを揃えて学習の効率を高める。
  • 例:Zスコア、Min-Maxスケーリングなど。

ラグ変数(過去値の導入)

  • 「1本前」「5本前」などの過去値を特徴量として加える。
  • 時系列的な文脈の理解に役立つ。

相対値・乖離率

  • ある基準(移動平均など)と比べての相対的な高さや低さ。
  • 現在の位置づけ(過熱・割安)を把握するために使う。

組み合わせ・多項式変換

  • 複数の特徴量を掛け合わせることで、相互作用や複雑なパターンを捉える。
  • 例:RSI × ボラティリティ、SMA差分など。

まとめ:特徴量設計の巧拙がAIトレードの命運を握る

AIトレードの精度は、アルゴリズムの種類以上に「どんな特徴量を使うか」で決まるといっても過言ではありません。たとえば、移動平均やインジケーターの数値自体は広く使われていますが、そのまま使うか、あるいは加工してモデルに適した形に整えるかで結果は大きく変わってきます。

さらに、特徴量の「量」と「質」のバランスが重要です。少なすぎると判断材料に乏しく、逆に多すぎると不要なパターンを学習してしまいます。そのため、「意味のある変数を少数精鋭で使う」「モデルによって使い分ける」「定期的に見直す」といった姿勢が求められます。

本記事では、AIモデルが“何を学んでいるのか”を理解するための出発点として、特徴量設計の考え方・作成技法・評価指標を整理しました。次回の記事では、こうして設計した特徴量が、バックテストや実践の中でどう機能するのかを検証するフェーズに進んでいきます。

コメント

タイトルとURLをコピーしました