予測エンジンは、過去の時系列データを分析し、各系列に最適なモデリング手法を自動的に選択します。
このプロセスは完全に自動化されており、予測実行中はバックグラウンドで動作するため、手動による設定やモデル選択は不要です。
予測エンジンは、以下を組み合わせたハイブリッドモデリング戦略を採用しています。
グローバル機械学習モデル:すべての系列に共通するパターンを学習します。
系列レベルの統計モデル:安定的かつ繰り返し発生する需要パターンを捉えます。
予測はどのように機能するのか?
各予測は、標準化された以下の手順に従って実行されます。
時間グリッドの作成。システムは欠損している日付を補完し、すべての時系列データに対して、欠損のない均等な間隔のタイムラインを作成します。これにより、モデル学習および予測の一貫性が確保されます。
詳細については、予測用データの準備 を参照してください。
特徴量エンジニアリング。カレンダー、ラグ、およびローリングベースの特徴量が、データから自動的に生成されます。
インテリジェントルーティング。各時系列データは、その需要パターンに基づいて分析および分類されます。
モデルの割り当てと予測。システムは各時系列データに最適なモデルを選択して適用し、予測を生成します。
特徴量エンジニアリング
学習時に、予測エンジンはモデルがデータ内のパターンや関係性を検出できるよう、特徴量を自動的に生成します。これには以下が含まれます。
カレンダー特徴量。曜日、月、祝日、季節指標など
ラグ特徴量。予測対象変数の過去の値(例:1期間前、7期間前、14期間前)
ローリング特徴量。移動平均や変動性の指標などの集計統計値
すべての特徴量は個々の時系列レベルで計算されるため、各時系列データは自身の過去の傾向から学習できます。
インテリジェントルーティング
モデル学習の前に、予測エンジンは Median Data Interval(MDI) を使用して各時系列データの過去のパターンを評価し、その需要パターンを特定します。
MDIとは?
MDI(Median Data Interval)は、時系列データ内で需要がどの程度の頻度で発生するかを測定する指標です。具体的には、想定される時間頻度に対して、ゼロ以外の観測値の典型的な間隔 を推定します。
MDIが低い → 需要は定期的に発生する
MDIが高い → 需要はまばら、または断続的に発生する
実務的には、MDIは需要が時間の経過とともにどの程度の頻度で発生するかを示します。
分類ルール
各時系列データは、MDI値に基づいて分類されます。
MDI ≤ 0.5 → 安定した需要
需要は一定のパターンで定期的に発生します。MDI > 0.5 → 断続的な需要
需要は不規則に発生し、需要の発生と発生の間に間隔があります。
この分類により、各時系列データに対してどのモデリング手法を適用するかが決定されます。
モデリング戦略
予測エンジンは、需要分類に応じて異なるモデルを適用します。
LightGBM(断続的な需要)
断続的な需要を持つ時系列データに対しては、予測エンジンは単一のグローバルLightGBMモデルを使用します。
ファイル全体のデータを対象に学習する
すべての時系列データに共通するパターンを学習する
まばらで不規則な需要を効果的に処理する
カレンダー、ラグ、およびローリング統計量などの特徴量を活用する
Prophet(安定した需要)
安定した時系列データに対しては、予測エンジンは各時系列固有の傾向を捉えるために個別のProphetモデルを学習します。
時系列データがProphetの対象となるのは、以下の条件を満たす場合のみです。
安定した需要(MDI ≤ 0.5) として分類されていること
少なくとも12件の観測値 を含んでいること
Prophetモデルの特徴:
各時系列ごとに個別に学習される
カレンダー、ラグ、およびローリング統計量などの特徴量を活用する
トレンドおよび季節性を自動的に検出する
統計的評価に基づき、適切な成長タイプ(線形成長またはフラット成長)を選択する。
まとめ
予測エンジンは、以下の要素を組み合わせています。
自動化されたデータ準備
MDIを使用したパターンベースの分類
LightGBMとProphetを組み合わせたハイブリッドモデリング
需要特性に基づく自動モデル選択
このアプローチにより、ユーザーによる介入なしで、安定した需要と断続的な需要の両方に対して、高精度かつスケーラブルな予測を実現できます。