マイニング モデルの精度を測定する前に、評価する結果を決定する必要があります。 ほとんどのデータ マイニング モデルでは、モデルの作成時に予測可能な属性として使用する列を少なくとも 1 つ選択する必要があります。 そのため、モデルの精度をテストするときは、通常、その属性を選択してテストする必要があります。
次の一覧では、テストで使用する予測可能な属性を選択するための追加の考慮事項について説明します。
一部の種類のデータ マイニング モデルでは、ニューラル ネットワークなどの複数の属性を予測できます。ニューラル ネットワークでは、多くの属性間のリレーションシップを調べることができます。
クラスタリング モデルなどの他の種類のマイニング モデルには、必ずしも予測可能な属性はありません。 クラスタリング モデルは、予測可能な属性がない限りテストできません。
散布図を作成したり、回帰モデルの精度を測定したりするには、結果として継続的な予測可能な属性を選択する必要があります。 その場合、ターゲット値を指定することはできません。 散布図以外のものを作成する場合は、基になるマイニング構造列のコンテンツ タイプが Discrete または Discretized である必要もあります。
予測可能な結果として不連続属性を選択した場合は、ターゲット値を指定することも、[ 予測値] フィールドを空白のままにすることもできます。 予測値を含める場合、グラフはターゲット値の予測におけるモデルの有効性のみを測定します。 ターゲットの結果を指定しない場合、モデルはすべての結果を予測する際の精度で測定されます。
複数のモデルを含め、それらを 1 つの精度グラフで比較する場合、すべてのモデルで同じ予測可能な列を使用する必要があります。
クロス検証レポートを作成すると、Analysis Services は、同じ予測可能な属性を持つすべてのモデルを自動的に分析します。
[ 予測列と値の同期] オプションが選択されている場合、Analysis Services は、同じ名前と一致するデータ型を持つ予測可能な列を自動的に選択します。 列がこれらの条件を満たしていない場合は、このオプションをオフにして、予測可能な列を手動で選択できます。 モデルとは異なる列を持つ外部データ セットを使用してモデルをテストする場合は、これを行う必要がある場合があります。 ただし、データの種類が正しくない列を選択すると、エラーまたは不適切な結果が発生します。
予測する結果を指定する
マイニング構造をダブルクリックして、データ マイニング デザイナーで開きます。
[ マイニング精度チャート ] タブを選択します。
[ 入力の選択] タブを選択します。
[ 入力の選択 ] タブの [ 予測可能な列名] で、グラフに含める各モデルの予測可能な列を選択します。
[ 予測可能な列名] ボックスで使用できるマイニング モデル列は、使用の種類が [予測 のみ] または [ 予測のみ] に設定されている列のみです。
モデルのリフトを決定するには、[予測値] リストから測定する特定の結果値を選択する必要があります。