[ 構造にモデルを追加] をクリックすると、既存のマイニング構造で使用する新しいマイニング モデルの作成に役立つウィザードが起動します。 このオプションは、同じデータに基づくモデルを比較したり、カスタマイズされたモデルを作成したりできるため便利です。
Analysis Services のインスタンスに必要なデータがまだ含まれていない場合は、 マイニング構造の作成 (SQL Server データ マイニング アドイン) ウィザードを使用してマイニング構造を設定します。 または、いずれかのモデリング ウィザードを起動し、ウィザードによって作成された構造に新しいモデルを追加できます。
ウィザードでサポートされていないアルゴリズムを使用して高度なモデルを作成するには、マイニング構造を作成し、 データ マイニング高度なクエリ エディターを使用してモデルを追加します。
既存の構造に新しいモデルを追加する
[ データ マイニング ] リボンの [ 詳細設定] の下にある矢印をクリックし、[ 構造にモデルを追加] を選択します。
[ 構造の選択 ] ダイアログ ボックスで、使用するデータを含む構造を選択し、[ 次へ] をクリックします。
ヒント: 必要なデータが含まれているマイニング構造がわからない場合は、 ドキュメント モデル ウィザードを使用して、データに関する列と基本的な統計情報を表示します。
マイニング構造が見つからない場合は、現在使用している接続を確認してください。 別のサーバーへの接続を開く必要がある場合があります。
[ マイニング アルゴリズムの選択 ] ダイアログ ボックスで、新しいマイニング モデルで使用するマイニング アルゴリズムを選択します。
ダイアログ ボックスには、ウィザードに表示されるより多くのオプションが用意されています。 データに互換性がある場合は、Analysis Services サーバーでサポートされている任意のアルゴリズムを使用してモデルを作成できます。
また、[ パラメーター ] ボタンをクリックして [ アルゴリズム パラメーター ] ダイアログ ボックスを開き、アルゴリズムのパラメーターをカスタマイズすることをお勧めします。 このオプションは、カスタム マイニング モデルを作成する最も簡単な方法です。
[次へ] をクリックします。
[ 列の選択 ] ダイアログ ボックスで列の一覧を確認し、必要に応じて、列の使用法を次のいずれかの値に変更します。
入力。 結果に影響を与える可能性があり、モデルへの入力として使用する必要がある変数が列に含まれていることを示します。
入力と予測。 データを入力として使用する必要があり、これらの値も予測することを示します。
予測のみ。 データをモデルの入力として使用しないことを示します。
Key。 各モデルには、少なくとも 1 つのキーが必要です。 モデルの種類によっては、 SequenceKey や TimeKey などの特別なキーを追加することもできます。
使用しないでください。 構造内に存在する場合でも、データをモデルで使用しないことを示します。
ブラウズ (...) ボタンをクリックして、列モデル フラグの設定 ダイアログ ボックスを開きます。
各データ列の使用がモデルに適していることを確認するには、1 分かかります。 これは、モデルを処理しようとしたときにエラーを防ぐための重要な手順です。
たとえば、デシジョン ツリー モデル用に作成された構造を再利用し、Naïve Bayes アルゴリズムを適用する場合、データ型
Numericとコンテンツ タイプContinuousを持つ列をビン分割するか、不連続変数に変更する必要があります。構造内の列が新しいアルゴリズムに適用できない場合は、[ 使用しない] を選択してそれらをバイパスできます。
[ 列モデル フラグの設定 ] ダイアログ ボックスで、モデリング フラグ (存在する場合) を確認または設定します。
モデリング フラグを使用すると、特に null の処理方法を制御できます。 詳細については、「 モデリング フラグ (データ マイニング)」を参照してください。
完了したら [OK] を クリックしてダイアログ ボックスを閉じます。
[ 完了 ] ダイアログ ボックスで、新しいマイニング モデルの名前と説明を入力します。
構築したモデルの種類によっては、次のオプションもあります。
完成したマイニング モデルをビルド後に参照します。
モデルからソース データへのドリルスルーを使用します。
詳細については、「 マイニング モデルでのドリルスルー」を参照してください。
[ 完了] をクリックして変更を保存します。 そうすると、新しいモデルがサーバーにデプロイされ、処理されます。
関連オプション
| 選択肢 | コメント |
|---|---|
| [構造またはモデルの選択 ] ダイアログ ボックス | 新しいモデルを構築するための基礎として使用する既存のマイニング構造を選択します。 選択する構造は、現在の接続に配置されている必要があります。 そうでない場合は、[ ソース データへの接続] (Excel 用データ マイニング クライアント) ツールを使用して接続を変更します。 |
| [マイニング アルゴリズムの選択 ] ダイアログ ボックス | データ マイニング アルゴリズムの一覧は、接続先のサーバーによって異なります。 Analysis Services には、Standard エディションと Enterprise エディションのさまざまなアルゴリズムが用意されています。 管理者がカスタム アルゴリズムを追加した可能性もあります。 アルゴリズムが表示されない場合は、Analysis Services のインスタンスに接続されていることを確認します。 |
| アルゴリズム パラメーター ダイアログ ボックス | これらの設定では、分析方法に固有のパラメーターを使用して、各アルゴリズムをカスタマイズできます。 シードを設定して、モデルの結果を複数のトレーニング パス間で確実に再現することもできます。 詳細については、「 アルゴリズム パラメーター (SQL Server データ マイニング アドイン)」を参照してください。 |
| 列モデル フラグの設定 ダイアログ ボックス | モデリング フラグを使用すると、不足しているデータを処理する方法を指定することで、モデルを改善できます。 詳細については、「 モデリング フラグ (データ マイニング)」を参照してください。 |
列の使用法の設定
既存のマイニング構造に新しいモデルを追加する場合は、マイニング構造内のデータの各列をモデルで使用する方法を指定する必要があります。 このウィザードのオプションは、マイニング構造のオプションよりもはるかに詳細であることがわかります。 なぜでしょうか。
その理由は、ウィザードを使用してモデルと構造を一緒に作成すると、アルゴリズムによるデータの使用方法を制御する多くのオプションが自動的に設定されるためです。 ただし、既存のモデルに新しいモデルを追加する場合は、これらのオプションを手動で表示し、データを分析に使用するかどうか、データ型が正しいかどうかを指定する必要があります。
既存のデータに新しいアルゴリズムを適用するとエラー メッセージが表示されることがありますが、通常、これらのメッセージはモデルの処理を許可するために必要な修正に関する詳細情報を提供します。 一般的な問題は次のとおりです。
モデルには、構造体に含まれているデータ型とは異なるデータ型が必要です。
一部のアルゴリズムは数値でのみ機能します。一部のユーザーはテキストのみを操作できます。 データが新しいモデルに対して間違った型である場合は、モデルが処理できるように構造を変更することが必要になる場合があります。
マイニング構造には予測可能な属性が含まれていません。
クラスタリング モデルは予測可能な値なしで構築できますが、通常、他のモデルでは予測用に 1 つの列を指定する必要があります。
データの構成は、選択したアルゴリズムと互換性がありません。
一部の種類の分析では、一意のルールに従って慎重に構造化されたデータが必要です。 たとえば、予測モデルとアソシエーション モデルがあります。 同じ種類の新しいモデル (カスタマイズなど) を簡単に追加できますが、他のアルゴリズムではデータが機能しない可能性があります。
要求事項
データ マイニング モデルを作成するには、Analysis Services のインスタンスへの接続が必要です。 接続を作成または変更する方法の詳細については、「 ソース データへの接続 (Excel 用データ マイニング クライアント)」を参照してください。
目的のデータ マイニング構造が表示されない場合は、構造が別のインスタンスまたは別の Analysis Services データベースに保存されている可能性があります。 別のデータ マイニング接続に変更する方法については、「 データ マイニング サーバーへの接続」を参照してください。