PlanIQ の用語と定義をいくつか紹介します。

属性

特徴が共通するもの同士で履歴データ アイテムをグループにまとめるカテゴリー情報が属性に含まれています (例: 商品カテゴリー)。属性には数値を使用できません。PlanIQ ではこれらの属性を使って類似するアイテムからパターンを検出します。

属性は通常、アイテムの階層要素かビジネス ディメンションを表します (店舗別 SKU など)。属性は、より精度の高いフォーキャストを生成するために使用されます。

バックテスト

バックテストは機械学習モデルを検証するための標準的な方法であり、機械学習モデルがフォーキャスト モデルの品質を評価します。バックテストはフォーキャスト モデルのパフォーマンスを測定するための手段です。バックテストの結果は Anaplan モデルにインポートできます。

過去の実績があるデータセットが与えられると、フォーキャスト モデルの学習メカニズムはそのデータセットの一部に対して自身で学習し、データセットの他の部分 (未確認部分) を予測することで自身をテストします。例:

  • 12 か月分の履歴データセットがあり、フォーキャスト対象期間は 3 か月だと仮定します。PlanIQ では最初の 9 か月に対して自身で学習し、次の 3 か月を予測します。
  • 次に、3 か月間の予測を同じ期間の実績と比較します。
  • PlanIQ ではこのような手順でモデルの精度を計算しています。

データ コレクション

データ コレクションには履歴データが含まれ、必要に応じて関連データと属性を含めることができます。フォーキャスト結果を生成するフォーキャスト モデルの学習に使用されます。 

分解

履歴データをさまざまなコンポーネントや変数に分割するフォーキャスト手法です。分割された各変数はその後フォーキャストで使用されます。これにより、フォーキャストに対する変数の影響を評価することができます。
たとえば、単位当たりの価格が利益に与える影響が月間広告費用よりも小さいかどうかを確認できます。 

終了アイテム (EOL)

終了 (End of Life) アイテムとは、データ コレクションに存在しているものの、既にフォーキャストに活用されていないと PlanIQ がみなしたアイテムです。あるアイテムが終了したものであると特定されると、PlanIQ のフォーキャスト アクションは、そのアイテムのフォーキャスト結果を生成しません。終了アイテムの例には既に販売されていない生産終了品があります。

終了のロジック

PlanIQ は、特定のアイテムの履歴データの最後のゼロ値 (末尾のゼロ) をカウントし、この情報を使ってそのアイテムが終了しているかどうかを決定します。以下のいずれかが該当している必要があります。

(1) 日次データ周期で末尾のゼロが少なくとも 14 件ある 

(2) 末尾のゼロがフォーキャスト対象期間を超過している例:

    • フォーキャスト対象期間が 3 ヶ月であるとします。
    • さらに過去 3 ヶ月、あるアイテムの履歴データがゼロでした。
    • この場合は、この条件に該当します。

(3) PlanIQ は、以下の場合、末尾のゼロをカウントする:

    • そのアイテムの過去 3 ヶ月のエントリーが 0 である 
    • そのアイテムの末尾のゼロが全履歴の 10% 以上である
    • その場合、これは終了アイテムとなります。 

このロジックは Anaplan Prophet と MVLR の両方に適用されます。 

説明可能性

機械学習ツールの決定内容と挙動を人間がより理解しやすい形にするモデルと方法。

フォーキャスト アクション

フォーキャスト アクションは直近の Actual (実績) から予測を生成します。このアクションでは、フォーキャスト結果と説明可能性情報 (サポート対象のアルゴリズムの場合) が PlanIQ から Anaplan モデルにインポートされます。

フォーキャスト対象期間

フォーキャストで予測を生成する、将来の期間。最長フォーキャスト対象期間は履歴データの深さと選択したアルゴリズムによって設定されます。

フォーキャスト モデル

フォーキャストを生成するためにデータ コレクションから学習したアルゴリズム。

フォーキャストの時間間隔

入力データ (履歴データと関連データ) と選択したアルゴリズムによって定義される、フォーキャスト対象データ ポイントの間隔。フォーキャストの時間間隔は 1 日ごと、1 週間ごと、又は 1 か月ごとにできます。

履歴データ (実績)

フォーキャストで使用するメインのデータ型。このデータは必須です。数値にし、時間ディメンションを含める必要があります。例として販売個数や支出などがあります。

ハイパーパラメーター

フォーキャスト モデルの学習プロセスの制御に値が使用されるパラメーターです。PlanIQ 内のモデル構成手順の一環としてハイパーパラメーターの調整が行われます。

間隔

将来の時間軸を予測するために使用される履歴時間軸の数です。たとえば、PlanIQ で 6 月のトレンドを計算する場合、3 か月分 (3 月、4 月、5 月) の履歴データが必要となります。同様に、PlanIQ で 2021 年 3 月の 1 年分の年間トレンド データポイントを取得するには、2020 年 3 月から 2021 年 3 月までの 12 か月分の履歴データが必要となります。 

ノイズ

データ ポイントがフォーキャストのトレンドから逸脱する場合を指し、剰余とも呼ばれます。時系列のフォーキャストでは、時系列の通常の挙動から逸脱する予測不可能なランダム データのことをノイズと呼びます。ノイズはモデルの品質を判断するうえで役立ちます。

関連データ (ドライバー)

追加のドライバー (ビジネスの要素と値) をフォーキャストに提供する、オプションのデータセット。関連データを使用することで、PlanIQ のフォーキャストの精度が上がります。例として、履歴データや将来のプロモーションなどがあります。関連データの例は以下のとおりです。

  • 時間ディメンション (過去および将来のプロモーションなど) 
  • フォーキャスト対象期間までの履歴データ ポイント 
  • フォーキャスト対象期間の長さをカバーする将来のデータ ポイント (必須ではありませんが、フォーキャストの精度向上のために推奨されています) 

スパース データ 

多くの値が 0 であるデータセットのことです。たとえば、ある商品の一定期間の需要を表すデータセットがあり、需要がゼロの期間が複数ある場合などがこれに当てはまります。

データ コレクションにデータセットを追加する前に、欠落データを表す真のゼロとゼロを区別するよう選択できます。このように区別することでフォーキャスト結果が歪められることを防ぐことができます。詳細については、「値の除外」を参照してください。

時系列

時間的に連続する一連のデータ ポイント (観測結果) のことで、一定期間ごとに発生します。

時系列のフォーキャスト

履歴データとその他のデータ型に基づく、時系列の将来の値の予測。