予測エンジンの概要

予測エンジンは、過去の時系列データを分析し、各系列に最適なモデリング手法を自動的に選択します。

このプロセスは完全に自動化されており、予測実行中はバックグラウンドで動作するため、手動による設定やモデル選択は不要です。

予測エンジンは、以下を組み合わせたハイブリッドモデリング戦略を採用しています。

予測はどのように機能するのか？

各予測は、標準化された以下の手順に従って実行されます。

時間グリッドの作成。システムは欠損している日付を補完し、すべての時系列データに対して、欠損のない均等な間隔のタイムラインを作成します。これにより、モデル学習および予測の一貫性が確保されます。
詳細については、予測用データの準備を参照してください。
特徴量エンジニアリング。カレンダー、ラグ、およびローリングベースの特徴量が、データから自動的に生成されます。
インテリジェントルーティング。各時系列データは、その需要パターンに基づいて分析および分類されます。
モデルの割り当てと予測。システムは各時系列データに最適なモデルを選択して適用し、予測を生成します。

学習時に、予測エンジンはモデルがデータ内のパターンや関係性を検出できるよう、特徴量を自動的に生成します。これには以下が含まれます。

すべての特徴量は個々の時系列レベルで計算されるため、各時系列データは自身の過去の傾向から学習できます。

モデル学習の前に、予測エンジンは Median Data Interval（MDI） を使用して各時系列データの過去のパターンを評価し、その需要パターンを特定します。

MDI（Median Data Interval）は、時系列データ内で需要がどの程度の頻度で発生するかを測定する指標です。具体的には、想定される時間頻度に対して、ゼロ以外の観測値の典型的な間隔 を推定します。

実務的には、MDIは需要が時間の経過とともにどの程度の頻度で発生するかを示します。

各時系列データは、MDI値に基づいて分類されます。

この分類により、各時系列データに対してどのモデリング手法を適用するかが決定されます。

予測エンジンは、需要分類に応じて異なるモデルを適用します。

断続的な需要を持つ時系列データに対しては、予測エンジンは単一のグローバルLightGBMモデルを使用します。

安定した時系列データに対しては、予測エンジンは各時系列固有の傾向を捉えるために個別のProphetモデルを学習します。

時系列データがProphetの対象となるのは、以下の条件を満たす場合のみです。

Prophetモデルの特徴：

予測エンジンは、以下の要素を組み合わせています。

このアプローチにより、ユーザーによる介入なしで、安定した需要と断続的な需要の両方に対して、高精度かつスケーラブルな予測を実現できます。