ユーザー定義集計

Power BI の集計により、大規模な DirectQuery セマンティックモデルに対するクエリパフォーマンスを向上させることができます。集計を使用すると、メモリ内の集計レベルでデータをキャッシュします。この記事の説明に従って、データモデルの Power BI で集計を手動で構成できます。 Premium サブスクリプションの場合、モデル設定で自動集計機能を有効にして、それらを自動的に作成できます。

集計テーブルの作成

データソースの種類に応じて、テーブルまたはビューのネイティブクエリとしてデータソースで集計テーブルを作成できます。パフォーマンスを最大限に高めるには、Power Query で作成されたインポートテーブルとして集計テーブルを作成します。 Power BI Desktop の [集計の管理] ダイアログを使用して、集計、詳細テーブル、および詳細列のプロパティを含む集計列の集計を定義します。

ディメンションデータソース (データウェアハウスやデータマートなど) では、リレーションシップベースの集計を使用できます。 Hadoop ベースの大規模なデータソースは、多くの場合、GroupBy 列に基づいて集計を行います。この記事では、データソースの種類ごとの一般的な Power BI データモデリングの違いについて説明します。

集計の管理

Power BI Desktop ビューの [データ ] ウィンドウで、集計テーブルを右クリックし、[ 集計の管理] を選択します。

[集計の管理] の選択のスクリーンショット。

[ 集計の管理 ] ダイアログには、テーブル内の各列の行が表示され、集計の動作を指定できます。次の例では、 Sales 詳細テーブルへのクエリは、Sales Agg 集計テーブルに内部的にリダイレクトされます。

[集計の管理] ダイアログボックスを示すスクリーンショット。

このリレーションシップベースの集計の例では、GroupBy エントリは省略可能です。 DISTINCTCOUNT を除き、これらは集計動作には影響せず、主に読みやすくするために使用されます。 GroupBy エントリがない場合でも、リレーションシップに基づいて集計がヒットします。この動作は、この記事で後述するビッグデータの例とは異なり、GroupBy エントリが必要です。

検証

[ 集計の管理 ] ダイアログでは、次の検証が適用されます。

詳細列には、集計列と同じデータ型が必要です。ただし、Count および Count テーブル行の集計関数を除きます。 Count と Count テーブル行は、整数集計列でのみ使用でき、一致するデータ型を必要としません。
3 つ以上のテーブルをカバーするチェーン集計は許可されません。たとえば、テーブル A の集計では、テーブル C を参照する集計があるテーブル B を参照することはできません。
重複する集計では、2 つのエントリが同じ集計関数を使用し、同じ 詳細テーブル と 詳細列を参照することはできません。
詳細テーブルでは、インポートではなく DirectQuery ストレージモードを使用する必要があります。
非アクティブなリレーションシップで使用される外部キー列によるグループ化と、集計ヒットの USERELATIONSHIP 関数への依存はサポートされていません。代わりに、USERELATIONSHIP の代わりに TREATAS 関数を使用することもできます。 TREATAS を使用する場合は、テーブル間にアクティブなリレーションシップがないことを確認します。この構成で TREATAS を使用する場合、集計は引き続き影響を受ける可能性があります。
GroupBy 列に基づく集計では集計テーブル間のリレーションシップを使用できますが、Power BI Desktop では集計テーブル間のリレーションシップの作成はサポートされていません。必要に応じて、XML for Analysis (XMLA) エンドポイントを使用して、サードパーティのツールまたはスクリプトソリューションを使用して集計テーブル間のリレーションシップを作成できます。

ほとんどの検証は、ドロップダウン値を無効にし、ヒントに説明テキストを表示することによって適用されます。

ツールチップで表示される検証

集計テーブルは非表示

モデルへの読み取り専用アクセス権を持つユーザーは、集計テーブルに対してクエリを実行できません。読み取り専用アクセスでは、 行レベルセキュリティ (RLS) で使用する場合のセキュリティ上の問題を回避できます。コンシューマーとクエリは集計テーブルではなく詳細テーブルを参照するため、集計テーブルについて知る必要はありません。

このため、集計テーブルは レポート ビューに表示されません。テーブルがまだ非表示になっていない場合、[ 集計の管理 ] ダイアログでは、[ すべて適用] を選択すると非表示に設定されます。

ストレージモード

集計機能は、テーブルレベルのストレージモードで動作します。 Power BI テーブルでは、 DirectQuery、 インポート、または デュアル ストレージモードを使用できます。 DirectQuery はクエリをバックエンドに直接送信し、Import はデータをメモリにキャッシュし、キャッシュされたデータにクエリを送信します。すべての Power BI Import データソースと非多次元 DirectQuery データソースは、集計で機能します。

集計テーブルのストレージモードをインポートに設定してクエリを高速化するには、Power BI Desktop モデル ビューで集計テーブルを選択します。 [プロパティ] ウィンドウで、[詳細設定] を展開し、[ストレージモード] で選択項目をドロップダウンして、[インポート] を選択します。ストレージモードを [インポート] に設定すると、もう一度変更することはできません。

ストレージモードの選択のスクリーンショット。

テーブルストレージモードの詳細については、「 Power BI Desktop でのストレージモードの管理」を参照してください。

集計の RLS

集計を正しく機能させるには、RLS 式で集計テーブルと詳細テーブルの両方をフィルター処理する必要があります。

次の例では、 Geography テーブルの RLS 式は集計に対して機能します。Geography は Sales テーブルと Sales Agg テーブルとのリレーションシップのフィルター処理側にあるためです。集計テーブルを使用するクエリと、RLS が正常に適用されていないクエリ。

集計に成功した RLS

Product テーブルの RLS 式では、集計された Sales Agg テーブルではなく、詳細 Sales テーブルのみがフィルター処理されます。集計テーブルは詳細テーブル内のデータのもう 1 つの表現であるため、RLS フィルターを適用できない場合は、集計テーブルからのクエリに応答するのは安全ではありません。このロールのユーザークエリは集計ヒットのメリットを得られないため、詳細テーブルのみをフィルター処理することはお勧めしません。

Sales Agg 集計テーブルのみをフィルター処理し、Sales 詳細テーブルをフィルター処理しない RLS 式は使用できません。

集計テーブルのみの RLS は許可されません

GroupBy 列に基づく集計の場合、集計テーブルのすべての GroupBy 列が詳細テーブルでカバーされるため、詳細テーブルに適用される RLS 式で集計テーブルをフィルター処理できます。一方、集計テーブルの RLS フィルターでは詳細テーブルをフィルター処理できないため、許可されません。

リレーションシップに基づく集計

ディメンションモデルでは、通常、 リレーションシップに基づいて集計が使用されます。データウェアハウスとデータマートの Power BI モデルは、スタースキーマとスノーフレークスキーマに似ています。ディメンションテーブルとファクトテーブル間のリレーションシップがあります。

次の例では、モデルは 1 つのデータソースからデータを取得します。テーブルでは DirectQuery ストレージモードが使用されます。 Sales ファクトテーブルには、数十億行が含まれています。 キャッシュのために Sales のストレージモードをインポートに設定すると、かなりのメモリとリソースのオーバーヘッドが消費されます。

モデル内の詳細テーブル

代わりに、 Sales Agg 集計テーブルを作成します。 Sales Agg テーブルの行数は、CustomerKey、DateKey、ProductSubcategoryKey でグループ化された SalesAmount の合計と等しくなります。 Sales Agg テーブルは Sales よりも細分性が高いので、数十億行ではなく数百万行が含まれている可能性があり、管理が容易になります。

次のディメンションテーブルがビジネス価値の高いクエリに最も一般的に使用されている場合、一対多リレーションシップや多対一リレーションシップを使用してSales Aggをフィルターすることができます。

地理学
カスタマー
日付
製品サブカテゴリ
製品カテゴリ

次の図は、このモデルを示しています。

モデル内の集計テーブル

次の表は、 Sales Agg テーブルの集計を示しています。

Sales Agg テーブルの集計

注

Sales Agg テーブルには、他のテーブルと同様に、さまざまな方法で読み込まれる柔軟性があります。ソースデータベースで集計を実行するには、ETL または ELT プロセスを使用するか、テーブルの M 式を使用します。集計テーブルでは、セマンティックモデルに対して増分更新の有無にかかわらず、インポートストレージモードを使用できます。または、DirectQuery を使用し、列ストアインデックスを使用して高速クエリ用に最適化することもできます。この柔軟性により、ボトルネックを回避するためにクエリの負荷を分散できるバランスの取れたアーキテクチャが可能になります。

集計された Sales Agg テーブルのストレージモードを インポート に変更すると、関連するディメンションテーブルをストレージモード Dual に設定できることを示すダイアログボックスが開きます。

[ストレージモード] ダイアログ

関連するディメンションテーブルを Dual に設定すると、サブクエリに応じて Import または DirectQuery として機能します。この例では、次のようになります。

インポートモード の Sales Agg テーブルからメトリックを集計し、関連するデュアルテーブルの属性別にグループ化するクエリは、メモリ内キャッシュから結果を返します。
DirectQuery Sales テーブルのメトリックを集計し、関連するデュアルテーブルの属性でグループ化するクエリは、DirectQuery モードで結果を返します。 GroupBy 操作を含むクエリロジックは、ソースデータベースに渡されます。

デュアルストレージモードの詳細については、「 Power BI Desktop でのストレージモードの管理」を参照してください。

通常のリレーションシップと制限されたリレーションシップ

リレーションシップに基づく集計ヒットには、通常のリレーションシップが必要です。

通常のリレーションシップには、次のストレージモードの組み合わせが含まれます。両方のテーブルが 1 つのソースから取得されます。

多くの側面にあるテーブル	1 面のテーブル
デュアル	デュアル
輸入	インポートまたはデュアル
DirectQuery	DirectQuery または Dual

ソース間リレーションシップが通常の場合は、両方のテーブルがインポートに設定されている場合のみです。多対多リレーションシップは常に制限されます。

リレーションシップに依存しない ソース間 集計ヒットについては、「 GroupBy 列に基づく集計」を参照してください。

リレーションシップベースの集計クエリの例

Date テーブルの 列は集計を使用できる粒度であるため、次のクエリでは集計が使用されます。 SalesAmount 列では、合計集計が使用されます。

リレーションシップベースの集計クエリの成功

次のクエリでは、集計は使用されません。 SalesAmount の合計を要求したにもかかわらず、クエリは Product テーブル内の列に対して GroupBy 操作を実行しています。これは、集計を使用できる粒度ではありません。モデル内のリレーションシップを観察すると、1 つの製品サブカテゴリに複数 の Product 行を含めることができます。クエリでは、集計先の製品を特定できません。この場合、クエリは DirectQuery に戻り、SQL クエリをデータソースに送信します。

集計を使用できないクエリ

集計は、単純な合計を実行する単純な計算だけではありません。複雑な計算にもメリットがあります。概念的には、複雑な計算は、SUM、MIN、MAX、COUNT ごとにサブクエリに分割されます。各サブクエリは、集計を使用できるかどうかを判断するために評価されます。このロジックは、クエリプランの最適化のためにすべてのケースで当てはまるわけではありませんが、一般的には適用する必要があります。次の例では、集計を使用します。

複雑な集計クエリ

COUNTROWS 関数は集計を利用して利点を得ることができます。次のクエリでは、Count テーブル行の集計がSalesテーブルに対して定義されているため、集計を使用します。

COUNTROWS 集計クエリ

AVERAGE 関数は集計の恩恵を受けることができます。 AVERAGE は内部的に COUNT で除算された SUM に折りたたまれるため、次のクエリでは集計が使用されます。 UnitPrice 列には SUM と COUNT の両方に対して集計が定義されているため、集計が使用されます。

AVERAGE 集計クエリ

場合によっては、DISTINCTCOUNT 関数は集計の恩恵を受けることができます。次のクエリでは、CustomerKey の GroupBy エントリがあるため、集計テーブル内で CustomerKey の区別を維持しつつ、集計を使用しています。この手法は、200 万から 500 万を超える個別の値がクエリのパフォーマンスに影響する可能性があるパフォーマンスしきい値に達する可能性があります。ただし、詳細テーブルには何十億もの行があり、列には 2 ~ 500 万の個別の値があるシナリオで役立ちます。この場合、DISTINCTCOUNT は、メモリにキャッシュされた場合でも、数十億行のテーブルをスキャンするよりも高速に実行できます。

DISTINCTCOUNT 集計クエリ

データ分析式 (DAX) のタイムインテリジェンス関数は、集計に対応しています。次のクエリでは、DATESYTD 関数によって CalendarDay 値のテーブルが生成され、集計テーブルは Date テーブル内のグループ化列に対応する粒度になっているため、集計が使用されます。これは、集計を操作できる CALCULATE 関数に対するテーブル値フィルターの例です。

SUMMARIZECOLUMNS 集計クエリ

GroupBy 列に基づく集計

Hadoop ベースのビッグデータモデルは、ディメンションモデルとは異なる特性を持ちます。大きなテーブル間の結合を回避するために、ビッグデータモデルではリレーションシップを使用せず、ファクトテーブルにディメンション属性を非正規化することがよくあります。このようなビッグデータモデルのロックを解除して、 GroupBy 列に基づく集計を使用して対話型分析を行うことができます。

次の表に、集計する移動の数値列を示します。他のすべての列は、グループ化する属性です。このテーブルには、IoT データと大量の行が含まれています。ストレージモードは DirectQuery です。モデル全体で集計されるデータソースに対するクエリは、ボリュームが大きいため、低速です。

IoT テーブル

このモデルで対話型分析を有効にするには、ほとんどの属性でグループ化する集計テーブルを追加しますが、経度や緯度などのカーディナリティの高い属性は除外します。この方法では、行数が大幅に減り、メモリ内キャッシュに快適に収まるように十分に小さくなります。

ドライバー活動集計表

[集計の管理] ダイアログで、 ドライバーアクティビティ Agg テーブルの 集計マッピングを 定義します。

Driver Activity Agg テーブルの集計の管理ダイアログ

GroupBy 列に基づく集計では、 GroupBy エントリは省略可能ではありません。これらを指定しないと、集計にヒットしません。この動作は、GroupBy エントリが省略可能なリレーションシップに基づく集計の使用とは異なります。

次の表は、 Driver Activity Agg テーブルの集計を示しています。

Driver Activity Agg 集計テーブル

集計された ドライバーアクティビティ Agg テーブルのストレージモードを [インポート] に設定します。

GroupBy 集計クエリの例

次のクエリでは、 アクティビティの日付 列が集計テーブルの対象となるため、集計が使用されます。 COUNTROWS 関数は、 Counted テーブル行 の集計を使用します。

GroupBy 集計クエリの成功

特に、ファクトテーブルにフィルター属性を含むモデルの場合は、 Count テーブル行 の集計を使用することをお勧めします。ユーザーが明示的に要求していない場合、Power BI は COUNTROWS を使用してモデルにクエリを送信できます。たとえば、フィルターダイアログには、各値の行数が表示されます。

[フィルター] ダイアログ

集計手法の組み合わせ

集計のリレーションシップと GroupBy 列の手法を組み合わせることができます。リレーションシップに基づく集計では、非正規化ディメンションテーブルを複数のテーブルに分割する必要があります。この要件が特定のディメンションテーブルに対してコストがかかるか実用的でない場合は、それらのディメンションの集計テーブルで必要な属性をレプリケートし、他のディメンションにリレーションシップを使用できます。

たとえば、次のモデルでは、Sales Agg テーブルの Month、Quarter、Semester、Year がレプリケートされます。 Sales Agg と Date テーブルの間にはリレーションシップはありませんが、Customer と Product Subcategory にはリレーションシップがあります。 Sales Agg のストレージモードは Import です。

集計手法の組み合わせ

次の表は、Sales Agg テーブルの [集計の管理] ダイアログで設定されたエントリを示しています。 Date 属性でグループ化するクエリに集計を使用するには、Date が詳細テーブルである GroupBy エントリが必須です。前の例と同様に、CustomerKey と ProductSubcategoryKey の GroupBy エントリは、リレーションシップが存在するため、DISTINCTCOUNT を除き、集計の使用には影響しません。

Sales Agg 集計テーブルのエントリ

集計クエリの組み合わせの例

次のクエリでは、集計テーブルが CalendarMonth を対象とし、一対多リレーションシップを通じて CategoryName にアクセスできるため、集計を使用します。このクエリでは、SalesAmount の SUM 集計が使用されます。

集計にヒットするクエリの例

集計テーブルには CalendarDay が含まれていないため、次のクエリでは集計は使用されません。

CalendarDay を含むクエリのテキストを示すスクリーンショット。

DATESYTD 関数は CalendarDay 値のテーブルを生成し、集計テーブルは CalendarDay を対象としていないため、次のタイムインテリジェンスクエリでは集計は使用されません。

DATESYTD 関数を含むクエリのテキストを示すスクリーンショット。

集計の優先順位

集計の優先順位により、1 つのサブクエリで複数の集計テーブルを考慮できます。

次の例は、複数のソースを含む複合モデルです。

Driver Activity DirectQuery テーブルには、大規模なデータシステムからソース化された数兆行を超える IoT データが含まれています。ドリルスルークエリを使用して、制御されたフィルターコンテキストで個々の IoT 読み取り値を表示します。
Driver Activity Agg テーブルは、DirectQuery モードの中間集計テーブルです。 Azure Synapse Analytics (旧称 SQL Data Warehouse) には 10 億行を超える行が含まれており、列ストアインデックスを使用してソースで最適化されています。
ドライバーアクティビティ Agg2 インポートテーブルは、グループ化属性が少なくカーディナリティが低いため、粒度が高くなります。行数は数千行と同じくらい少ないため、メモリ内キャッシュに簡単に収めることができます。これらの属性は、高いプロファイルを持つエグゼクティブダッシュボードで使用されるため、それらを参照するクエリは可能な限り高速にする必要があります。

注

詳細テーブルとは異なるデータソースを使用する DirectQuery 集計テーブルは、集計テーブルが SQL Server、Azure SQL、または Azure Synapse Analytics (旧称 SQL Data Warehouse) ソースからのみサポートされます。

このモデルのメモリ占有領域は比較的小さいが、巨大なモデルのロックを解除する。これは、アーキテクチャのコンポーネント間でクエリの負荷を分散し、その長所に基づいてそれらを利用するため、バランスの取れたアーキテクチャを表します。

巨大なモデルのロックを解除する小さなフットプリントモデルのテーブル

ドライバーアクティビティ Agg2 の [管理された集計] ダイアログでは、[優先順位] フィールドが 10 に設定されます。これは、ドライバーアクティビティ Agg の場合よりも高くなります。優先順位の設定が高いほど、集計を使用するクエリでは、最初に ドライバーアクティビティ Agg2 が考慮されます。 ドライバーアクティビティ Agg2 が応答できる粒度ではないサブクエリは、代わりにドライバーアクティビティ Agg を考慮できます。どちらの集計テーブルでも応答できない詳細クエリは、 ドライバーアクティビティに送ることができます。

詳細テーブル列に指定されたテーブルは、ドライバーアクティビティAgg ではなく、ドライバーアクティビティです。チェーン集計は許可されないためです。

[優先順位] が強調表示されている [集計の管理] ダイアログボックスを示すスクリーンショット。

次の表は、 ドライバーアクティビティ Agg2 テーブルの集計を示しています。

ドライバーアクティビティ Agg2 集計テーブル

クエリが集計にヒットしたか見落とされたかを検出する

SQL Profiler は、クエリがメモリ内キャッシュストレージエンジンから取得されたかどうか、または DirectQuery がクエリをデータソースにプッシュするかどうかを検出できます。同じプロセスを使用して、集計が使用されているかどうかを検出できます。詳細については、「キャッシュにヒットまたはミスしたクエリ」を参照してください。

SQL Profiler では、 Query Processing\Aggregate Table Rewrite Query 拡張イベントも提供されます。

次の JSON スニペットは、集計が使用される場合のイベントの出力の例を示しています。

matchingResult は、サブクエリが集計を使用することを示しています。
dataRequest には、サブクエリで使用される GroupBy 列と集計列が表示されます。
マッピング には、マップ先の集計テーブル内の列が表示されます。

集計が使用される場合のイベントの出力

キャッシュの同期を維持する

DirectQuery、インポート、デュアルストレージモードを組み合わせた集計では、インメモリキャッシュがソースデータと同期している場合を除き、異なるデータが返される可能性があります。たとえば、クエリの実行では、キャッシュされた値と一致するように DirectQuery の結果をフィルター処理することで、データの問題をマスクしようとはしません。ソースでこれらの問題を処理する必要がある場合があります。パフォーマンスの最適化によって、ビジネス要件を満たす能力が損なわれることはありません。データフローを理解し、それに応じて設計する必要があります。

考慮事項と制限事項

集計では、動的 M クエリパラメーターはサポートされていません。
2022 年 8 月以降、機能の変更により、Power BI では、セキュリティリスクの可能性があるため、シングルサインオン (SSO) が有効なデータソースを含むインポートモード集計テーブルは無視されます。集計で最適なクエリパフォーマンスを確保するには、これらのデータソースの SSO を無効にします。

Community

Power BI には、MVP、BI 担当者、同僚がディスカッショングループ、ビデオ、ブログなどの専門知識を共有する活気に満ちたコミュニティがあります。集計について学習するときは、次のリソースを必ず確認してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-06-02

次の方法で共有

ユーザー定義集計

集計テーブルの作成

集計の管理

検証

集計テーブルは非表示

ストレージ モード

集計の RLS

リレーションシップに基づく集計

通常のリレーションシップと制限されたリレーションシップ

リレーションシップベースの集計クエリの例

GroupBy 列に基づく集計

GroupBy 集計クエリの例

集計手法の組み合わせ

集計クエリの組み合わせの例

集計の優先順位

クエリが集計にヒットしたか見落とされたかを検出する

キャッシュの同期を維持する

考慮事項と制限事項

Community

関連コンテンツ

フィードバック

その他のリソース

ストレージモード