次の方法で共有


クラスター ウィザード (Excel 用データ マイニング アドイン)

データ マイニング リボンのクラスターウィザード

クラスター ウィザードを使用すると、類似した特性を共有する行を検出し、グループ化してグループ間の距離を最大化するモデルを構築できます。 このウィザードは、あらゆる種類のデータのパターンを見つけるのに役立ちます。

クラスター ウィザードは Microsoft クラスタリング アルゴリズムを使用し、広範囲にカスタマイズできます。 これは、Excel テーブル、Excel 範囲、または Analysis Services クエリの既存のデータに対して機能します。 同様の機能は、テーブル分析ツール for Excel で提供される カテゴリの検出 ツールによって提供されます。 ただし、[カテゴリの検出] ツールはカスタマイズできず、Excel テーブルのデータを使用する必要があります。

クラスター ウィザードの使用

  1. [データ マイニング] リボンで、[ クラスター] をクリックし、[ 次へ] をクリックします。

  2. [ ソース データの選択 ] ページで、Excel のテーブルまたは範囲を選択します。 または、外部データ ソースを指定します。

    外部データ ソースを使用する場合は、カスタム ビューを作成するか、カスタム クエリ テキストに貼り付け、データセットを Analysis Services データ ソースとして保存できます。

  3. [ クラスタリング ] ページでは、モデルの構築方法をカスタマイズできます。

    • [セグメントの数] では、ウィザードに対して、固定数のカテゴリを作成するか、グループ化の最適な数を自動的に検出するように指示できます。

    • [入力列] リストの列の一覧を確認し、パターンの作成に役立たない列の選択を解除します。 除外する必要がある列には、ID 番号、顧客名などが含まれます。

  4. 必要に応じて、[ パラメーター ] をクリックしてアルゴリズム パラメーターを変更し、クラスタリング モデルの動作をカスタマイズします。

  5. [ データをトレーニング セットとテスト セットに分割 する] ページで、テスト用に保持するデータの量を指定します。 残りの部分は、常にモデルのトレーニングに使用されます。

    既定の設定は、テスト データ% 30 個、トレーニング データ% 70 個です。

  6. [ 完了] ページで、データセットとモデルのわかりやすい名前を指定し、完成したモデルの操作方法を制御する次のオプションを設定します。

    • モデルを参照します。 このオプションを選択すると、ウィザードでモデルの処理が完了するとすぐに[ 参照 ]ウィンドウが開き、結果を確認できます。 ビューアーの内容は、構築したモデルの種類によって異なります。 詳細については、「 クラスタリング モデルの参照」を参照してください。

    • ドリルスルーを有効にします。 完成したモデルの基になるデータを表示するには、このオプションを選択します。 このオプションは、デシジョン ツリー モデルを構築する場合にのみ使用できます。

    • 一時的なモデルを使用します。 このオプションを選択した場合、モデルはサーバーに保存されません。 Excel を閉じると、一時モデルが削除されます。

クラスタリング モデルの詳細

このウィザードで使用するクラスタリング アルゴリズムを変更するには、[ 詳細設定 ] をクリックし、[ アルゴリズム パラメーター] ダイアログ ボックスを使用します。

Microsoft クラスタリング アルゴリズムには、次のクラスタリング方法が用意されています。

  • K 平均 - スケーラブルまたは非スケーリング。

  • 期待の最大化 (EM) - スケーラブルまたは非スケーリング。

また、CLUSTER_SEED パラメーターを使用して開始値を制御し、同じデータ セットを使用する繰り返しモデルの結果が同じになるようにすることもできます。

要求事項

クラスター ウィザードを使用するには、Analysis Services データベースに接続されている必要があります。 詳細については、「 ソース データへの接続 (Excel 用データ マイニング クライアント)」を参照してください。

こちらもご覧ください

データ マイニング モデルの作成
カテゴリの検出 (Excel 用テーブル分析ツール)