クラスタリング手法を適用する
クラスタリングを使用すると、相互に似ているが残りのデータとは異なるセグメント (クラスター) を識別できます。 クラスタリングのプロセスは、前のユニットで学習したグループ化のプロセスとは異なります。
Power BI のクラスタリング機能を使用すると、データのサブセット内で類似したデータ ポイントのグループをすばやく見つけることができます。 セマンティック モデルを分析して属性値の類似点と相違点を識別し、類似点を持つデータをデータのサブセットに分割します。 これらのデータのサブセットは、クラスターと呼ばれます。
たとえば、売上データから、顧客全体の行動などのパターンを見つけたい場合もあります。 顧客を年齢や場所などの類似性に基づいて、クラスターに分割することができます。
まず始めに、[散布図] ビジュアル化をレポートに追加し、次に必要なフィールドをビジュアルに追加します。 この例では、A 軸に Order Qty フィールド、Y 軸に Sales フィールド、および値に Unit Price フィールドを追加します。
次の図では、散布図に非常に多くのデータが示されているため、自然なグループを識別するのは困難です。
散布図にクラスタリングを適用するには、ビジュアルの右上隅にある その他のオプション (…) を 選択し、クラスターの自動検索 を選択します。
クラスター ウィンドウでは、必要に応じて既定の名前、フィールド、および説明を編集できます。 ただし、この例ではクラスターの数を変更する必要があります。 次の図は、クラスターの数 ボックスが既定で空白になっていることを示しています。これは、Power BI がデータに最も適切であると判断されたクラスターの数を自動的に検出することを意味します。
必要なクラスターの数 (3) をボックスに入力し、OK を選択します。 Power BI はクラスタリング アルゴリズムを実行し、異なるクラスター グループを含む新しいカテゴリ フィールドを作成します。 ここでビジュアルを確認すると、データ内のクラスターを明確に見つけることができ、クラスター分析の実行に進むことができます。
新しいクラスター フィールドが散布図の凡例ウェルに追加され、他の 凡例 フィールドと同様にクロス強調表示のソースとして使用可能になりました。 新しいクラスター フィールドがデータ モデルに追加され、データ ペインで見つけることができます。
クラスターを編集する場合は、クラスター フィールドを右クリックし、クラスターの編集 を選択します。
上の例では、クラスタリングを散布図に適用した場合、2 つのメジャーしか使用できませんでした。 3 つ以上のメジャーを使用してクラスターを検索する場合、代わりにテーブル ビジュアルを使用できます。 この場合は、使用するフィールドをすべて追加し、同じプロセスを使用してクラスタリング アルゴリズムを実行します。