集計の作成および管理
データを集計するときは、そのデータを要約し、より高い粒度で提示します。 たとえば、売上データを集計し、日付、顧客、製品など別にグループ化することができます。 集計プロセスによってセマンティック モデルのテーブル サイズが削減されるため、重要なデータに集中し、クエリのパフォーマンスを向上させることができます。
組織では、次のような理由から、セマンティック モデルで集計を使用することを決定する場合があります。
- 大量のデータを使用する場合。 この場合、集計によりクエリ パフォーマンスが向上し、大規模なデータを分析して、分析情報を明らかにするのに役立ちます。 集計データはキャッシュされるため、詳細なデータに必要とされるリソースのわずかな割合が使用されます。
- データの更新が遅いと感じている。 この場合、集計を使用すると更新プロセスを速くすることができます。 キャッシュ サイズを小さくすると、更新時間が短縮されるため、データがより高速にユーザーに返されます。 数百万行に及ぶ可能性のあるデータを更新する代わりに、少量のデータを更新します。
- 大規模なセマンティック モデルがある。 この場合、集計はモデルのサイズの削減と維持に役立ちます。
- 今後セマンティック モデルの増加が見込まれる。 この場合、パフォーマンスや更新の問題、全体的なクエリの問題の可能性を軽減することにより、セマンティック モデルを将来にわたって確実に保護するための積極的なステップとして集計を使用できます。
Tailwind Traders のシナリオを続けていて、あなたはセマンティック モデルのパフォーマンスを最適化するために複数の手順を行いましたが、IT チームからファイル サイズがまだ大きすぎるという連絡がありました。 ファイルのサイズは現在 1 ギガバイト (GB) であるため、約 50 メガバイト (MB) まで減らす必要があります。 パフォーマンス レビュー中、以前の開発者がセマンティック モデルで集計を使用していなかったことが判明したため、今度は売上データの集計を作成してファイル サイズを削減し、パフォーマンスをさらに最適化したいと考えています。
集計の作成
集計を作成する前に、集計を作成する粒度レベルを決定する必要があります。 この例では、日レベルで売上データを集計します。
粒度を決定するときは、次の手順として、集計を作成する方法を決定します。 集計はさまざまな方法で作成でき、それぞれの方法で同じ結果が生成されます。次に例を示します。
- データベースにアクセスできる場合は、テーブル (またはビュー) を作成して、それを Power BI Desktop にインポートできます。
- Power BI Desktop では、Power Query を使用して集計を段階的に作成できます。
この例では、Power Query でクエリを開くと、データが集計されていないことがわかります。次のスクリーンショットに示すように、行数は 999 を超えています。
OrderDate 列でグループ化し、OrderQuantity 列と SalesAmount 列を集計します。 まず、ホーム リボン タブの 列の選択 を選択します。開いたウィンドウで、集計に含める列を選択し、OK を選択します。
選択した列がページに表示されたら、ホーム リボンタブの グループ化 オプションを選択します。開いたウィンドウで、グループ化する列 (OrderDate) を選択し、新しい列の名前 (OnlineOrdersCount) を入力します。
詳細 オプションを選択し、集計の追加 ボタンを選択して別の列行を構成します。 集計列の名前を入力し、列の操作を選択して、集計のリンク先となる列を選択します。 これらの手順を繰り返し、すべての集計を追加したら、OK を選択します。
集計のプレビューが表示されるまで数分かかる場合がありますが、表示されると、データがどのように変換されたかがわかります。 データは日付ごとに集計され、注文数と、それぞれの売上高と注文数量の合計値を確認できます。
閉じて適用 ボタンを選択して Power Query エディターを閉じ、セマンティック モデルに変更を適用します。 Power BI Desktop の ホーム リボン タブで、更新 を選択します。 セマンティック モデルに読み込まれた行数を示す簡単なメッセージが表示されるので、画面を観察します。 この行数は、開始時の数よりも大幅に少なくなっています。 次のスクリーンショットに示すように、Power Query エディターを再度開いたときにもこの数が表示されます。 この例では、行数が 30 に削減されています。
999 行以上あったことを思い出してください。 集計を使用すると、セマンティック モデル内の行数が大幅に削減されます。つまり、Power BI で更新するデータが少なくなり、モデルのパフォーマンスが向上します。
集計を管理する
必要に応じて、後で Power BI Desktop で集計を管理し、その動作を変更できます。
Power BI Desktop のどのビューからでも 集計の管理 ウィンドウを開くことができます。 データ ペインでテーブルを右クリックし、集計の管理 を選択します。
集計列ごとに、概要 ドロップダウン リストからオプションを選択し、選択した詳細テーブルと列に変更を加えることができます。 集計の管理が完了したら、すべて適用 を選択します。
集計の作成および管理方法の詳細については、Power BI Desktop で集計を使用するを参照してください。