統計の要約を調査する

完了

データは多くの場合、統計と絡み合って不可分な関係にあります。これは、統計はデータを調査するための 1 つの方法であるためです。 統計はデータの分布を示すことができるほか、重要な情報と傾向を識別し、外れ値が存在するかどうかを確認するのに役立ちます。

統計の要約では、データの簡単な説明がすぐに提供されます。 Power BI には、統計分析を実行するのに役立つ多くの機能があります。 統計の要約を調べることで、ユーザーは使用可能なデータの概要ビューを見ることができ、このビューでは、クラスター、行動データのパターン、データの平均などを確認できます。 データに関する分析情報が得られ、ビジネス上の意思決定に役立ちます。

たとえば、サプライ チェーン チームから、特定の製品の注文の頻度と、売上の上位 10 製品を示すレポートを作成するように依頼されます。

統計関数

Power BI は、データに基づいて簡単な統計情報を取得するために使用できる多くの Data Analytics Expressions (DAX) 関数をサポートしています。 次の図に示すように、ビジュアル化 ペインでビジュアルのウェルに割り当てられた集計可能なフィールドを右クリックすると、これらのクイック機能にアクセスできます。

統計関数のスクリーンショット。

ただし、パフォーマンスの問題を回避するには、DAX で記述された式を使用して統計メジャーを自分で作成することをお勧めします。 たとえば、各製品の平均注文数量を分析するには、次のメジャーを作成できます。

Average Qty =
AVERAGE ( Sales[Order Qty] )

ヒストグラム

ヒストグラムとベル曲線は、セマンティック モデルに関する統計を表示する一般的な方法です。 Power BI の用語では、次の図に示すように、ヒストグラムを棒グラフまたは縦棒グラフのビジュアルで表し、ベル曲線を面グラフのビジュアルで表すことができます。 また、Q&A ビジュアル化を使用して、リスト内の上位または下位の項目について直接質問することもできます。

Power BI の棒グラフと面グラフのスクリーンショット。

Power BI の一般的な横棒グラフまたは縦棒グラフ ビジュアルでは、メジャーと分析コードという 2 つのデータ ポイントが関連付けられます。 ヒストグラムは 1 つのデータ ポイントのみをビジュアル化するという点で、標準の横棒グラフと若干異なります。

この例では、集合縦棒グラフ ビジュアルを使用して、注文サイズごとの注文数を判別するヒストグラムを表示できます。

まず始めに、ビジュアル化 ペインの [集合縦棒グラフ] アイコンを選択します。 次に、X 軸の新しいグループを作成します。 グループ化とビン分割についてはこのモジュールの後半で説明しますが、今のところは、これらがこのコンテキストでも役立つことを理解してください。

グループを作成するには、データ ペインで、分析するデータ フィールドを右クリックし、新しいグループを選択します。 この場合、OrderQty フィールドを使用できます。 グループ ウィンドウで、ビン グループを次のように構成します。

  1. グループの名前を Order Bins (Buckets) に変更します。
  2. グループの種類 オプションを ビンに設定し、ビンの種類 オプションをビン数に設定します。
  3. ビン数5最小値1最大値44 に設定します。

ヒストグラムのグループを追加しているスクリーンショット。

次に、次のようにビジュアルを設定します。

  1. OrderQty フィールドを データ ペインから ビジュアル化 ペインのウェルにドラッグします。
  2. Order Bins (Buckets) フィールドを データ ペインから ビジュアル化 ペインのウェルにドラッグします。

ビン サイズ別の注文数量の棒グラフを設定しているスクリーンショット。

ビジュアルでは、データが X 軸上のバケットにグループ化され、その変数の注文数量が Y 軸に表示されます。

ヒストグラムには、サプライ チェーン チームの注文サイズ バケット別に注文数量が表示されます。

上位 N 分析

TOPN DAX 関数は、指定されたテーブルの上位 N 行を返します。 トップ N 分析は、売上上位 10 製品、組織内のパフォーマンス上位 10 社、顧客上位 10 社など、重要と思われるデータを提示するための一般的な手法です。 または、これを別の観点から見て、リストの下位 10 項目を表示することもできます。 つまり、最も業績の悪いものです。 要件に応じて、これらの手法の 1 つまたは両方を使用することをお勧めします。

サプライ チェーン チームが売上上位 10 位の製品を知りたいというシナリオを考えてみましょう。 このタスクは、Q&A ビジュアル、上位 N フィルターを使用するか、DAX メジャーを作成することによって実行できます。

Q&A ビジュアルを使用して上位 N を見つける

サプライ チェーン チーム用のレポートを作成し、チーム メンバーが関心のあるさまざまな他のビューや分析情報について質問しているとします。 Power BI には、ユーザーが独自の質問をして回答を得ることができる Q&A ビジュアルが組み込まれています。 つまり、レポートのビジュアルを使用して、個々の質問に対処する必要はありません。

Q&A ビジュアルは、ユーザーがデータに関する回答を迅速かつ独立して得ることができるため、効果的なツールです。 関係するすべてのユーザーの時間を節約できます。 Q&A ビジュアルは、Power BI に関する事前の知識を必要とせず、ユーザーが質問できるという点で独特です。

Q&A ビジュアルをレポートに追加し、必要に応じてビジュアルの位置を変更して、書式設定をカスタマイズします。

Q&A ビジュアル化を追加しているスクリーンショット。

これで、ビジュアルを使用して回答を得ることができます。 この場合、売上上位 10 製品を知りたいので、売上上位 10 製品は何ですか? などの質問を入力します。Power BI によって結果が自動的に表示されます。

Q&A ビジュアル化を使用して上位 N を表示しているスクリーンショット。

上位 N フィルターを使用する

[上位 N] は、フィルター ペインで選択できるフィルター処理オプションです。 レポート ページで分析するフィールドを選択します (この例では、Product Name フィールド)。 フィルター ペインで、フィルター タイプ リストを展開し、上位 N 件を選択します。アイテムの表示設定で、上位 10 件を選択します。 次に、フィルタリングする値として Cost of Sales フィールドを設定します。

フィルターの種類を使用して上位 N を表示しているスクリーンショット。

TOPN 関数を使用する

TOPN関数を使用して、DAX で上位 10 製品を計算することもできます。 この関数を使用すると、売上上位 10 位の製品が全体の売上合計にどれだけ貢献したかなど、トップ 10 リストを別のコンテキストで表示できます。

まず、Top 10 Products という名前のメジャーを作成します。 次に、TOPN 関数と SUMX 関数を併用して、次のように売上合計における上位 10 製品を計算します。

Top 10 Products =
SUMX (
    TOPN (
        10,
        'Product',
        'Product'[Total Sales]
    ),
    [Total Sales]
)

次の画像は、売上合計と比較した上位 10 製品を示しています。

DAX 関数 TOPN を使用して上位 10 製品を計算したスクリーンショット。

DAX の数式を少し変更して、同じ結果をパーセンテージで表示することができます。

DAX の統計機能の詳細については、統計関数を参照してください。