Note
AI 機能のすべての準備データの作成は、Power BI サービスと Power BI Desktop の両方では使用できません。 これらの機能の使用は、Copilot が存在するすべての場所で利用できます。
ツール機能
Copilot 用にデータを準備するのに役立つ Power BI の現在の機能は何ですか?
現在、Power BI には、自然言語処理の準備ができるようにモデルを構成するための 4 つの主要なツール機能が用意されています。
- AI データ スキーマ: Copilot で使用するスキーマのサブセットを選択できます。
- 検証済みの回答: モデル作成者によって設定された構成済みの応答で、精度と信頼性が検証されます。 作成者は、ユーザーが割り当てられたカテゴリに該当する質問をしたときに、検証済みの回答で使用する Copilot の特定のビジュアルを設定できます。
- AI の手順: モデルに設定して、モデル内のデータに関するより多くのコンテキストを提供し、Copilot がどのようなデータに焦点を当てるかを理解するのに役立ちます。また、ユーザーが Copilot と対話するときに使用する可能性のある特定のマッピングを理解するのに役立ちます。
- 説明: データのコンテキストの詳細を提供するために、テーブルと列に設定された説明。 説明は、データ分析式 (DAX) q クエリと Copilot 検索機能でのみ使用されます。
Power BI Copilot ツール機能をどのような順序で実装する必要がありますか?
Power BI Copilot から最大限の価値を得るには、次の順序でツール機能を実装することをお勧めします。
-
まず、データの質問に回答するときに Copilot が参照する必要がある特定のテーブル、フィールド、メジャーを選択します。
モデルの開発時に、エンドユーザーのクエリに関連しない要素を含めることができます。 スキーマを絞り込むには、Copilot がモデルの最も意味のある部分に焦点を当てるのに役立ち、あいまいさが軽減されます。特に、重複するフィールドまたは同様の名前のフィールドを持つ大規模なデータセットでは、あいまいさが軽減されます。
ここでは、AI データ スキーマが Copilot が適切なデータに集中するのにどのように役立つかの例を示します。
スキーマ全体が使用されている場合、Copilot は、販売を言うときにユーザーの意図が明確になるとは限りません。 この場合、Copilot は売上の正当な解釈である GPM (粗利益率) を返しましたが、このチームが通常売上の分析に使用するメトリックではありません。
モデルの作成者は、AI のデータを準備し、Copilot に渡されるスキーマに含まれる GPM の合計メジャーを削除します。
ユーザーが同じ質問をすると、Copilot は回答を取得する場所をより明確にし、このチームが定義した売上とメジャーとして正しく解釈します。
-
ユーザーが尋ねる可能性がある一般的な質問や微妙な質問に対して、検証済みの回答を設定します。
これを行うには、ビジュアルを選択し、[確認済みの回答の作成] を選択します。次に、ユーザーが質問を表現する可能性を反映するトリガー フレーズを追加します。 ユーザーが Copilot で一致または類似の語句を入力すると、信頼できるビジュアルが返されます。これにより、レポート全体で一貫性のある高品質の応答が保証されます。
次の例は、検証済みの回答の利点を示しています。 ユーザーがエリア別の売上を要求します。 Copilot は、エリアを製品領域として解釈し、製品とその売上の一覧を返します。 ただし、ユーザーは地域または場所別の売上を探していました。
モデル作成者は、地域別の売上を含むビジュアルを使用して、検証済みの回答を設定します。 ビジュアルに対して検証済みの回答を設定することを選択した後、モデル作成者は、ユーザーから要求されたときにこの特定のビジュアル応答を返すトリガー フレーズを含めます。
ここで、ユーザーがエリア別の売上を確認すると、モデル作成者によって承認された検証済みの回答が Copilot によって返されます。
-
スキーマと検証済みの回答を定義したら、AI 命令を使用して、モデル レベルで Copilot の動作をガイドします。
手順は、ビジネス ロジックを明確にし、ユーザー用語をモデル フィールドにマップし、特定の種類のデータを解釈または分析する方法を Copilot に指示するのに役立ちます。 これらは、Copilot がそれ以外の場合は推論しないコンテキストを提供する場合に役立ちます。
次の例は、AI 命令を使用して Copilot により多くのコンテキストを提供する方法を示しています。 ユーザーは、2012 年の繁忙期に販売を依頼しました。 繁忙期は、この組織内でよく使用される明確に定義されたフレーズです。 ただし、セマンティック モデルでは、この用語はどこにも示されません。 モデル作成者は、繁忙期が 6 月から 8 月に定義される命令を設定します。
ユーザーが繁忙期の売上についてもう一度質問すると、Copilot はこの定義された用語を理解し、応答を提供できます。
テーブルと列に説明を追加します。
説明は、Copilot がモデルを理解するために使用できる追加のメタデータを提供します。
現在、説明は一部の Copilot 動作にのみ影響しますが、今後の機能ではより大きな役割を果たします。 それらを追加することで、Power BI での自然言語対話による長期的な成功のための強力な基盤を構築できます。
モデルの代わりにレポートにツールを作成できますか?
現在、ツール機能と構成機能はモデルでのみ使用できます。 同じモデルから構築された異なるレポートの構成はまだサポートされていません。 スキーマ、検証済みの回答、手順、および説明はセマンティック モデルに設定されますが、レポートには設定されません。
Copilot のデータを準備することで影響を受けるのはどの Copilot 機能ですか?
次の表を参照してください。
| Capability | AI データ スキーマ | 検証済みの回答 | AI の手順 | Descriptions |
|---|---|---|---|---|
| レポートの概要を取得する | No | No | Yes | No |
| レポートのビジュアルについて質問する | No | Yes | Yes | No |
| セマンティック モデルについて質問する | Yes | Yes | Yes | No |
| レポート内のページを作成する | No | No | Yes | No |
| Search | No | Yes | No | Yes |
| DAX クエリ | No | No | Yes | Yes |
使用する機能を把握する
私はCopilotに適切なフィールドを選択させようとしています。 どの機能を使用する必要がありますか?
AI データ スキーマを定義します。
ユーザーのニーズに関係のないテーブル、列、またはフィールドを削除します。 これにより、Copilot はモデルの最も関連性の高い部分に焦点を当て、クエリに応答するときに適切なフィールドを選択できるようになります。
レポート内のビジュアルに対して検証済みの回答を使用します。
質問に対する回答がレポート内のビジュアルから派生できる場合は、検証済みの回答を作成します。 これにより、ユーザーが特定のトリガー フレーズで質問すると、Copilot は正しいビジュアルを一貫して返します。
特定のフィールドの手順をカスタマイズします。
スキーマと検証済みの回答を設定したら、AI 命令を使用して、特定のフィールドを選択するときに Copilot をガイドできます。 他の準備データ AI 機能を設定した後に、微調整や高度なシナリオに関する手順を使用することをお勧めします。 この一連の手順を使用することで、モデルの構造と定義された命令に従って、Copilot が最も正確でコンテキストに関連する結果をユーザーに返すようにします。
私は使用している用語をCopilotに理解させようとしています。 どの機能を使用する必要がありますか?
Copilot という用語が、モデル内で参照する正しい項目が常に同じであることを理解するのに苦労している場合は、AI 命令を使用して代替名を指定できます。
たとえば、チームが製品を販売するユーザーを "クローザー" と呼ぶ場合、最適なオプションは、"売り手" を "クローザー" とも呼ばれるように設定して AI 命令の参照を提供することです。
私はCopilotに条件やグループ化の用語を理解させようとしています。 どの機能を使用する必要がありますか?
チームで、モデル内のテーブル/フィールドと完全に 1 対 1 の一致ではない特定の用語を使用している場合、AI 命令を使用すると、特定の条件またはグループ化で異なる項目を明確にするのに役立ちます。
たとえば、営業チームは、特定の月に 100% を超える目標を販売する人として"ハイ パフォーマー" を分類できます。 その後、Copilot に次の手順を指定できます。
高いパフォーマーとは、月間目標の 100% 以上を満たす販売者を意味します。
さて、ユーザーが「先月のハイパフォーマーは誰でしたか」と尋ねると、Copilot は、チームと組織でハイ パフォーマーが何を意味するかの定義を理解します。
別の例として、チームが異なる季節を分類する方法が含まれます。 たとえば、Jan-May は遅いシーズンとしてチームで参照され、6 月から 9 月は繁忙期、10 月から 12 月は標準シーズンである可能性があります。
AI の手順では、次の設定を行うことができます。
- スローシーズン は1月から5月を意味します。
- 繁忙期 は 6 月から 9 月を意味します。
- 標準シーズン は 10 月から 12 月を意味します。
次に、ユーザーが "昨年の繁忙期の総売上は何でしたか" と尋ねると、Copilot は、ユーザーが繁忙期を意味する期間を理解します。
私は最も一般的に尋ねられる質問に正しい答えを返すようにCopilotを取得しようとしています。 どの機能を使用する必要がありますか?
レポートとデータのコンシューマーには、最も頻繁に質問される一般的な質問がある可能性があります。 これに対処する最善の方法は、検証済みの回答をモデルに適用することです。 ビジュアルを選択し、トリガー フレーズを設定して検証済みの回答を適用します。トリガー フレーズは、ユーザーがトピックについて尋ねると、割り当てられたビジュアルを使用して情報を返します。
たとえば、レポートとモデルのコンシューマーは、売上の合計と金額に関して"前週の売上が最も高かった製品は何ですか" という質問をよくします。 検証済みの回答を設定すると、Copilot は適切な情報を取得する場所を理解し、提供された回答で作成者と消費者の信頼を構築するのに役立ちます。
私はCopilotがドメインまたはユーザーグループに基づいて異なる答えを返そうとしています。 どの機能を使用する必要がありますか?
現在存在する機能は、広範な消費に限定されています。 現在、さまざまなグループに基づく用語集の作成はサポートされていません。 たとえば、エンジニアに対する使用量が "クリック回数" を意味し、製品マネージャーへの使用量が "特定の月に顧客に支払う" ことを意味する場合、2 つの異なる方法でモデルの "使用状況" を定義することは現在サポートできません。
AI 用のデータを準備する
"Copilot は現在データ モデルと同期しています" というエラーが表示されます。 これはどういう意味ですか?
Copilot が最高のパフォーマンスを発揮できるようにするには、コピロットがセマンティック モデルの基になるデータを理解できることが重要です。 Power BI Copilot が基になるデータを理解しようとする 1 つの方法は、セマンティック モデルのインデックスを作成して、一致する関連する値を正確に検索することです。 これにより、Copilot はユーザーのプロンプトに基づいて効果的に質問に回答できます。
ハワイ観光データセットについて考えてみましょう。 「マウイ島の観光客の訪問にどのような影響を与えるか」のような質問に答えるために、Copilot は、Maui が Island テーブルの Island name 列のセマンティック モデルのインスタンス値であることを理解する必要があります。
これらのインスタンス値を効果的に検索する機能を Copilot に提供するために、セマンティック モデルは Q&A が有効になっているときにインデックスが作成され、Power BI がモデルに対して変更が行われたと検出したときにインデックスが再作成されます。
モデルのインデックス作成の頻度
インデックス作成は、Q&A 設定が有効になっているすべてのモデルに対して行われます。
Note
インポート モデルの場合、Q&A 設定は既定でオンになっています。 この設定の詳細については、Q&A 設定のドキュメントを参照してください。
インデックスの再作成は、次のいずれかのアクションが実行されるときに発生します。
-
インポート モデルの場合:
- モデルがサービスに発行/再発行されました。
- モデルは手動またはスケジュールされた更新によって更新され、Copilot/Q&A は過去 14 日以内に使用されました。
-
Direct Query モデルと Direct Lake モデルの場合:
- モデルがサービスに発行/再発行されました。
- インデックスが 24 時間より古く、過去 14 日以内に Copilot/Q&A が使用されました。
Copilot の次のメッセージは、モデルが現在インデックス作成中であることを示しています。 インデックス作成が完了すると、メッセージは自動的に解決されます。
Note
このエラーは、Copilot をユーザーが使用できないことを意味するものではありません。 このメッセージは、インデックス作成アクティビティが完了するまで、モデルで追加または変更された新しいインスタンス値が Copilot の応答に反映されない可能性があることを示します。
インデックス作成手法
セマンティック モデルのテキスト列は、インデックスが作成される唯一の列です。 AI スキーマで [Prep your data for AI]\(AI 用のデータの準備 \) 機能によって非表示になっている列にはインデックスが作成されません。
最大 500 万のインスタンス値が列でインデックス付けされ、最初にインデックスが作成されるカーディナリティが最も小さくなります。 列のカーディナリティは、インポート モデルの DISTINCTCOUNT と直接クエリ モデルの COLUMNSTATISTICS によって決定されます。 直接クエリ ソースの場合、 COLUMNSTATISTICS 関数は、それをサポートする基になるデータ ソースに APPROXIMATEDISTINCTCOUNT 関数を使用して、おおよその列カーディナリティを効率的に判断します。 インデックス作成によってクエリが急増する Direct Query モデルの基になるシステムのオーバーロードをさらに防ぐために、 COLUMNSTATISTICS の結果がキャッシュされ、統計が 7 日ごとに再計算されます。 インデックス作成プロセス中に、500 万インスタンス値の上限が次の列のインデックス作成と交差する場合、列のインデックス作成は完全にスキップされます。
インデックス作成の制限に達した場合でも、Copilot は作成したインデックスに基づいて回答しますが、すべてのインスタンス値が含まれるわけではありません。 問題のセマンティック モデルがインデックス作成の制限に達すると、次の警告が表示されます。
既知の制限事項
- インデックス作成の上限は、500 万インスタンス値か、大規模なセマンティック モデルの場合は 1,000 個のモデル エンティティ (テーブル/列) です。
- 100 文字以上のテキスト値にはインデックスが作成されません。
- ダイレクト クエリ モデルでは、
APPROXIMATEDISTINCTCOUNTをサポートするデータ ソースの列にのみインデックスが作成されます。 - Direct Query モデルと Direct Lake モデルのインデックス作成は、モデルが再発行されない限り、24 時間の間に 1 回行われます。