次の方法で共有


顧客の有効期間の値を予測する (CLV)

個々のアクティブな顧客が、定義された将来の期間を通じてビジネスにもたらす潜在的な価値 (収益) を予測します。 この予測は、次の場合に役立ちます。

  • 価値の高い顧客を特定し、この分析情報を処理します。
  • 潜在価値に基づいて戦略的な顧客セグメントを作成し、ターゲットを絞った販売、マーケティング、サポートの取り組みでパーソナライズされたキャンペーンを実行します。
  • 顧客価値を高める機能に重点を置いて、製品開発をガイドします。
  • 販売またはマーケティング戦略を最適化し、顧客のアウトリーチのためにより正確に予算を割り当てます。
  • ロイヤルティまたは報酬プログラムを通じて、価値の高い顧客を認識し、報酬を与える。

CLV がビジネスにとってどのような意味を持つのかを判断します。 トランザクションベースの CLV 予測をサポートします。 顧客の予測値は、ビジネス トランザクションの履歴に基づいています。 さまざまな入力設定で複数のモデルを作成し、モデルの結果を比較して、ビジネス ニーズに最も適したモデル シナリオを確認することを検討してください。

ヒント

サンプル データを使用して CLV 予測を試す: カスタマー ライフタイム値 (CLV) 予測サンプル ガイド

[前提条件]

  • 少なくとも 共同作成者の アクセス許可
  • 必要な予測ウィンドウ内に少なくとも 1,000 個の顧客プロファイル
  • 顧客識別子。トランザクションを個々の顧客に一致させる一意の識別子です。
  • 少なくとも 1 年間の取引履歴、2 年 から 3 年が望ましい。 理想的には、顧客 ID ごとに少なくとも 2 ~ 3 つのトランザクション (できれば複数の日付にまたがっています)。 トランザクション履歴には、次のものが含まれている必要があります。
    • トランザクション ID: 各トランザクションの一意の識別子
    • トランザクションの日付: 各トランザクションの日付またはタイム スタンプ
    • 取引金額: 各取引の金額 (収益や利益率など)
    • 戻り値に割り当てられたラベル: トランザクションが戻り値かどうかを示すブール値 true/false 値
    • 製品 ID: トランザクションに関係する製品の製品 ID
  • 顧客アクティビティに関するデータ:
    • 主キー: アクティビティの一意識別子
    • タイムスタンプ: 主キーによって識別されるイベントの日付と時刻
    • イベント (アクティビティ名):使用するイベントの名前
    • 詳細 (金額または値): 顧客アクティビティに関する詳細
  • 次のような追加データ:
    • Web アクティビティ: Web サイトのアクセス履歴または電子メールの履歴
    • ロイヤルティ アクティビティ: ロイヤルティ リワード ポイントの計上と引き換え履歴
    • カスタマー サービス ログ: サービスコール、苦情、または返品履歴
    • 顧客プロファイル情報
  • 必須フィールドの欠損値% 20 未満

構成できるトランザクション履歴テーブルは 1 つだけです。 複数の購入テーブルまたはトランザクション テーブルがある場合は、データ インジェストの前に Power Query でそれらを組み合わせます。

顧客の有効期間の値の予測を作成する

予測 を下書 きとして保存するには、いつでも [下書きを保存] を選択します。 下書き予測が [ マイ予測 ] タブに表示されます。

  1. Insights>Predictions に移動します。

  2. [作成] タブで、[顧客の有効期間の値] タイルで [モデルを使用] を選択します。

  3. [Get started](作業を開始する) を選択します。

  4. このモデル出力テーブル名に名前 を付けて、他のモデルまたはテーブルと区別します。

  5. [次へ] を選択します。

モデルの基本設定を定義する

  1. 予測期間を設定して、CLV を予測する将来までの距離を定義します。 既定では、単位は月として設定されます。

    ヒント

    設定された期間の CLV を正確に予測するには、同等の履歴データ期間が必要です。 たとえば、今後 12 か月間の CLV を予測する場合は、少なくとも 18 ~ 24 か月の履歴データがあります。

  2. 顧客がアクティブと見なされるトランザクションを少なくとも 1 つ持っている必要がある期間を設定します。 このモデルでは、 アクティブな顧客の CLV のみが予測されます。

    • モデルが購入間隔を計算できるようにする (推奨) : モデルはデータを分析し、購入履歴に基づいて期間を決定します。
    • 手動で間隔を設定する: アクティブな顧客の定義の期間。
  3. 価値の高い顧客のパーセンタイルを定義します。

    • モデルの計算 (推奨): モデルでは 80/20 ルールが使用されます。 過去の期間にビジネスの累積収益が 80% に貢献した顧客の割合は、価値の高い顧客と見なされます。 通常、30 ~ 40 未満の% のお客様は、累積収益の 80% に貢献します。 ただし、この数は、ビジネスや業界によって異なる場合があります。
    • 上位のアクティブな顧客の割合: 価値の高い顧客に対する特定のパーセンタイル。 たとえば、「 25 」と入力して、将来の有料顧客の上位 25% として価値の高い顧客を定義します。

    ビジネスで価値の高い顧客を別の方法で定義している場合は、 ぜひお知らせください

  4. [次へ] を選択します。

必要なデータを追加する

  1. [顧客トランザクション履歴] の [データの追加] を選択します。

  2. トランザクション履歴を含むセマンティック アクティビティの種類である SalesOrder または SalesOrderLine を選択します。 アクティビティが設定されていない場合は、 ここで 選択して作成します。

  3. [アクティビティ] で、アクティビティの作成時にアクティビティ属性が意味的にマップされた場合は、計算に重点を置く特定の属性またはテーブルを選択します。 セマンティック マッピングが発生しなかった場合は、[ 編集] を選択してデータをマップします。

    CLV モデルに必要なデータを追加する

  4. [ 次へ ] を選択し、このモデルに必要な属性を確認します。

  5. 保存 を選択します。

  6. さらにアクティビティを追加するか、[ 次へ] を選択します。

オプションのアクティビティ データを追加する

主要な顧客との対話 (Web、顧客サービス、イベント ログなど) を反映するデータは、トランザクション レコードにコンテキストを追加します。 顧客アクティビティ データに含まれるパターンが多いほど、予測の精度が向上する可能性があります。

  1. [Boost model insights with additional activity data]\(モデル分析情報のブースト\) で [データの追加] を選択します。

  2. 追加する顧客アクティビティの種類に一致するアクティビティの種類を選択します。 アクティビティが設定されていない場合は、 ここで 選択して作成します。

  3. [アクティビティ] で、アクティビティの作成時にアクティビティ属性がマップされた場合は、計算に重点を置く特定の属性またはテーブルを選択します。 マッピングが行われなかった場合は、[ 編集] を選択してデータをマップします。

  4. [ 次へ ] を選択し、このモデルに必要な属性を確認します。

  5. 保存 を選択します。

  6. [次へ] を選択します。

  7. オプションの顧客データを追加 するか、[ 次へ ] を選択し、[ 更新スケジュールの設定] に移動します。

オプションの顧客データを追加する

一般的に使用される 18 個の顧客プロファイル属性から選択し、モデルへの入力として含めます。 これらの属性により、ビジネス ユース ケースに合わせて、よりパーソナライズされ、関連性が高く、実用的なモデルの結果が得られます。

たとえば、Contoso Coffee は、新しいエスプレッソ マシンの発売に関連するパーソナライズされたオファーを使用して、顧客の有効期間の価値を予測し、価値の高い顧客をターゲットにしたいと考えています。 Contoso は CLV モデルを使用し、18 個すべての顧客プロファイル属性を追加して、最も価値の高い顧客に影響を与える要因を確認します。 顧客の所在地が、これらの顧客にとって最も影響力のある要因であると見なされます。 この情報を使用して、彼らはエスプレッソマシンの発売のための地元のイベントを開催し、パーソナライズされたオファーとイベントでの特別な経験のために地元のベンダーと提携します。 この情報がないと、Contoso は一般的なマーケティング電子メールのみを送信し、価値の高い顧客のこのローカル セグメントに合わせてカスタマイズする機会を逃した可能性があります。

  1. [Boost model insights]\(モデル分析情報のブースト\) で[ データの追加 ]を選択 し、追加の顧客データをさらに追加します

  2. [テーブル] で、[顧客] : [CustomerInsights] を選択し、顧客属性データにマップする統合顧客プロファイルを選択します。 [顧客 ID] で、[System.Customer.CustomerId] を選択します。

  3. 統合された顧客プロファイルでデータが使用可能な場合は、さらにフィールドをマップします。

    顧客プロファイル データのマップされたフィールドの例。

  4. 保存 を選択します。

  5. [次へ] を選択します。

更新スケジュールを設定する

  1. 最新のデータに基づいてモデルを再トレーニングする頻度を選択します。 この設定は、新しいデータが取り込まれると予測の精度を更新するために重要です。 ほとんどの企業は、1 か月に 1 回再トレーニングを行い、予測の精度を高めることができます。

  2. [次へ] を選択します。

モデル構成を確認して実行する

[ 確認と実行 ] ステップには、構成の概要が表示され、予測を作成する前に変更を加える機会が得られます。

  1. いずれかの手順で [編集] を選択して、変更を加えます。

  2. 選択内容に問題がなければ、[ 保存して実行] を選択してモデルの実行を開始します。 完了を選択します。 [ My predictions]\(予測 \) タブは、予測の作成中に表示されます。 このプロセスは、予測で使用されるデータの量によっては、完了までに数時間かかる場合があります。

ヒント

タスクやプロセスの状態 があります。 ほとんどのプロセスは、データ ソースやデータ プロファイル更新 などの他の上流プロセスに依存しています。

状態を選択して プロセス詳細 ペインを開き、タスクの進行状況を表示します。 ジョブをキャンセルするには、ペインの下部のジョブをキャンセルするを選択します

各タスクの下で、処理時間、最終処理日、タスクまたはプロセスに関連する該当エラーや警告など、詳細な進捗情報について 詳細を表示 を選択します。 パネル下部のシステムの状態を見るを選択すると、システム内の他のプロセスを見ることができます。

予測結果を表示する

  1. Insights>Predictions に移動します。

  2. [ マイ予測 ] タブで、表示する予測を選択します。

結果ページには、データの 3 つの主要なセクションがあります。

  • トレーニング モデルのパフォーマンス: グレード A、B、または C は予測のパフォーマンスを示し、出力テーブルに格納されている結果を使用するかどうかを決定するのに役立ちます。

    グレード A を含むモデル スコア情報ボックスの画像。

    システムは、ベースライン モデルと比較して高価値の顧客を予測する AI モデルの実行方法を評価します。

    成績は、次の規則に基づいて決定されます。

    • モデルがベースライン モデルと比較して、少なくとも 5% より価値の高い顧客を正確に予測した場合。
    • B モデルがベースライン モデルと比較して、より価値の高い顧客% 0 から 5 の間で正確に予測された場合。
    • モデル がベースライン モデルと比較して価値の高い顧客を正確に予測した場合の C。

    [ このスコアについて学習 する] を選択すると、[ モデル評価 ] ウィンドウが開き、AI モデルのパフォーマンスとベースライン モデルの詳細が表示されます。 基になるモデル パフォーマンス メトリックと、最終的なモデル パフォーマンス グレードがどのように導き出されたかをより深く理解するのに役立ちます。 ベースライン モデルでは、非 AI ベースのアプローチを使用して、主に顧客が行った過去の購入に基づいて顧客の有効期間の値を計算します。

  • パーセンタイル別の顧客の価値: 低価値の顧客と価値の高い顧客がグラフに表示されます。 ヒストグラムのバーにカーソルを合わせると、各グループの顧客数とそのグループの平均 CLV が表示されます。 必要に応じて、CLV 予測に基づいて 顧客のセグメントを作成 します。

    CLV モデルのパーセンタイル別の顧客の価値

  • 最も影響力のある要因: AI モデルに提供される入力データに基づいて CLV 予測を作成する際には、さまざまな要因が考慮されます。 各要因は、モデルによって作成される集計予測に対して計算される重要度を持っています。 これらの要因を使用して、予測結果を検証します。 これらの要因は、すべての顧客の CLV の予測に貢献した最も影響力のある要因に関するより多くの分析情報も提供します。

    CLV モデルの最も影響力のある要因

スコアについて学習する

ベースライン モデルによる CLV の計算に使用される標準式:

各顧客の CLV = アクティブな顧客ウィンドウで顧客が行った平均月間購入数 * CLV 予測期間の月数 * すべての顧客の全体的なリテンション率

AI モデルは、2 つのモデル パフォーマンス メトリックに基づいてベースライン モデルと比較されます。

  • 価値の高い顧客を予測する成功率

    AI モデルを使用した価値の高い顧客の予測とベースライン モデルの違いを確認します。 たとえば、84% 成功率は、トレーニング データ内のすべての価値の高い顧客のうち、AI モデルが 84%を正確にキャプチャできることを意味します。 次に、この成功率とベースライン モデルの成功率を比較して、相対的な変化を報告します。 この値は、モデルに成績を割り当てるために使用されます。

  • エラー メトリック

    将来の値を予測する場合のエラーの観点から、モデルの全体的なパフォーマンスを確認します。 このエラーを評価するには、全体的な平方平均二乗誤差 (RMSE) メトリックを使用します。 RMSE は、定量的データを予測するモデルの誤差を測定する標準的な方法です。 AI モデルの RMSE はベースライン モデルの RMSE と比較され、相対的な差が報告されます。

AI モデルは、ビジネスにもたらす価値に応じて、顧客の正確な順位付けに優先順位を付けます。 そのため、最終的なモデル のグレードを導き出すために使用されるのは、価値の高い顧客を予測する成功率だけです。 RMSE メトリックは外れ値に依存します。 非常に高い購入値を持つ顧客の割合が少ないシナリオでは、RMSE メトリック全体がモデルのパフォーマンスの全体像を把握できない可能性があります。