このトピックでは、データ マイニング デザイナーの [精度グラフ] タブを使用してクロス検証レポートを作成する手順について説明します。 クロス検証レポートの外観と、それに含まれる統計メジャーに関する一般的な情報については、「 クロス検証 (Analysis Services - データ マイニング)」を参照してください。
クロス検証レポートは、リフト チャートや分類マトリックスなどの精度グラフとは根本的に異なります。
クロス検証は、モデルまたは構造体で使用されるデータの全体的な分布を評価します。したがって、テスト・データ・セットは指定しません。 クロス検証では、モデルまたはマイニング構造のトレーニングに使用された元のデータのみが常に使用されます。
クロス検証は、単一の予測可能な結果に対してのみ実行できます。 構造で異なる予測可能な属性を持つモデルがサポートされている場合は、予測可能な出力ごとに個別のレポートを作成する必要があります。
クロス検証には、現在選択されている構造に関連するモデルのみが使用できます。
現在選択されている構造でクラスタリング モデルと非クラスタリング モデルの組み合わせがサポートされている場合、[ 結果の取得] をクリックすると、クロス検証ストアド プロシージャは、同じ予測列を持つモデルを自動的に読み込み、同じ予測可能な属性を共有しないクラスタリング モデルを無視します。
マイニング構造が他の予測可能な属性をサポートしていない場合にのみ、予測可能な属性を持たないクラスタリング モデルに対してクロス検証レポートを作成できます。
マイニング構造を選択する
SQL Server Data Tools (SSDT) でデータ マイニング デザイナーを開きます。
ソリューション エクスプローラーで、レポートを作成する構造またはモデルを含むデータベースを開きます。
マイニング構造をダブルクリックして、データ マイニング デザイナーで構造とその関連モデルを開きます。
[ マイニング精度チャート ] タブをクリックします。
[ クロス検証 ] タブをクリックします。
クロス検証オプションを設定する
[ クロス検証 ] タブの [フォールドカウント] で下矢印をクリックし、1 ~ 10 の数値を選択します。 既定値は 10 です。
Fold Count は、元のデータ セット内に作成されるパーティションの数を表します。 Fold Count を 1 に設定した場合、トレーニング セットはパーティション分割なしで使用されます。
[ターゲット属性] で下矢印をクリックし、一覧から列を選択します。 モデルがクラスタリング モデルの場合は、 #Cluster を選択して、モデルに予測可能な属性がないことを示します。 値 #Cluster は、マイニング構造が他の種類の予測可能な属性をサポートしていない場合にのみ使用できます。
レポートごとに予測可能な属性は 1 つだけ選択できます。 既定では、同じ予測可能な属性を持つすべての関連モデルがレポートに含まれます。
[Max Cases]\(最大ケース\) では、データが指定されたフォールドの数に分割されるときに、データの代表的なサンプルを提供するのに十分な大きさの数値を入力します。 この数がモデル トレーニング セット内のケースの数より大きい場合は、すべてのケースが使用されます。
トレーニング データ セットが非常に大きい場合、[ 最大ケース 数] の値を設定すると、処理されるケースの合計数が制限され、レポートの完了時間が短縮されます。 ただし、Max Cases を低く設定しすぎると、クロス検証に必要な十分なデータが得られない可能性があります。
必要に応じて、[ ターゲット状態] に、モデル化する予測可能な属性の値を入力します。 たとえば、[Bike Buyer] 列に 1 (はい) と 2 (いいえ) の 2 つの値がある場合は、値 1 を入力して、目的の結果についてのみモデルの精度を評価できます。
注
値を入力しない場合、[ ターゲットしきい値 ] オプションは使用できず、モデルは予測可能な属性のすべての可能な値に対して評価されます。
必要に応じて、[ ターゲットしきい値] に 0 ~ 1 の 10 進数を入力して、予測を正確としてカウントする必要がある最小確率を指定します。
確率のしきい値を設定するための追加のヒントについては、「クロス検証レポートの評価指標」を参照してください。
[ 結果の取得] をクリックします。
クロス検証レポートを印刷する
[ クロス検証 ] タブで完了したレポートを右クリックします。
ショートカット メニューの [ 印刷 ] または [ 印刷プレビュー ] を選択して、最初にレポートを確認します。
Microsoft Excel でレポートのコピーを作成する
[ クロス検証 ] タブで完了したレポートを右クリックします。
ショートカット メニューの [ すべて選択] を選択します。
選択したテキストを右クリックし、[ コピー] を選択します。
選択内容を開いている Excel ブックに貼り付けます。 [貼り付け] オプションを使用すると、レポートが HTML として Excel に貼り付けられ、行と列の書式設定が保持されます。 テキストまたは Unicode テキストの [特殊な貼り付け] オプションを使用してレポートを貼り付けると、レポートは行区切り形式で貼り付けられます。