Compartir a través de


Prueba de precisión con gráficos de elevación (Tutorial básico de minería de datos)

En la pestaña Gráfico de precisión de minería de datos del Diseñador de minería de datos, puede calcular cómo cada uno de los modelos realiza predicciones y comparar los resultados de cada modelo directamente con los resultados de los otros modelos. Este método de comparación se conoce como gráfico de elevación. Normalmente, la precisión predictiva de un modelo de minería de datos se mide mediante elevación o precisión de clasificación. En este tutorial usaremos solo el gráfico de elevación.

En este tema, realizará las siguientes tareas:

Elección de los datos de entrada

El primer paso para verificar la precisión de tus modelos de minería es seleccionar la fuente de datos que utilizarás para la prueba. Probará el rendimiento de los modelos con los datos de prueba y, a continuación, los usará con datos externos.

Para seleccionar el conjunto de datos

  1. Cambie a la pestaña Gráfico de precisión de la minería de datos en el Diseñador de minería de datos de SQL Server Data Tools (SSDT) y seleccione la pestaña Selección de Entrada.

  2. En el cuadro de grupo Seleccionar conjunto de datos para el Gráfico de Precisión, seleccione Usar casos de prueba de la estructura de minería. Estos son los datos de prueba que se reservan al crear la estructura de minería de datos.

    Para obtener más información sobre las otras opciones, vea Elegir un tipo de gráfico de precisión y Establecer opciones de gráfico.

Establecer parámetros de gráfico de precisión

Para crear un gráfico de precisión, debe definir tres cosas:

  • ¿Qué modelos debe incluir en el gráfico de precisión?

  • ¿Qué atributo de predicción desea medir? Algunos modelos pueden tener varios destinos, pero cada gráfico solo puede medir un resultado a la vez.

    Para usar una columna como nombre de columna predecible en un gráfico de precisión, las columnas deben tener el tipo de uso de Predict o Predict Only. Además, el tipo de contenido de la columna de destino debe ser Discrete o Discretized. En otras palabras, no se puede medir la precisión de las salidas numéricas continuas mediante el gráfico de elevación.

  • ¿Desea medir la precisión general del modelo o su precisión para predecir un valor determinado (como [Bike Buyer] = 'Sí')

Para generar el gráfico de elevación

  1. En la pestaña Selección de entrada del Diseñador de minería de datos, en Seleccionar columnas de modelo de minería de datos predecibles para mostrar en el gráfico de elevación, active la casilla Sincronizar columnas y valores de predicción.

  2. En la columna Nombre de Columna Predecible, compruebe que Bike Buyer está seleccionado para cada modelo.

  3. En la columna Mostrar , seleccione cada uno de los modelos.

    De forma predeterminada, se seleccionan todos los modelos de la estructura de minería. Puede decidir no incluir un modelo, pero para este tutorial deje todos los modelos seleccionados.

  4. En la columna Predict Value (Predecir valor ), seleccione 1. El mismo valor se rellena automáticamente para cada modelo que tiene la misma columna de predicción.

  5. Seleccione la pestaña Gráfico de elevación .

    Al hacer clic en la pestaña , se ejecuta una consulta de predicción para obtener predicciones para los datos de prueba y los resultados se comparan con los valores conocidos. Los resultados se trazan en el gráfico.

    Si especificó un resultado de destino determinado mediante la opción Predecir valor , el gráfico de elevación traza los resultados de las estimaciones aleatorias y los resultados de un modelo ideal.

    • La línea de estimación aleatoria muestra la precisión del modelo sin usar ningún dato para orientar sus predicciones: es decir, una división del 50-50 entre dos resultados. El gráfico de elevación le ayuda a visualizar el rendimiento del modelo en comparación con una estimación aleatoria.

    • La línea de modelo ideal representa el límite superior de precisión. Muestra la máxima ventaja posible que podría lograr si el modelo siempre predice con precisión.

    Los modelos de minería de datos que creó normalmente se encontrarán entre estos dos extremos. Cualquier mejora respecto a una conjetura aleatoria se considera como lift.

  6. Utiliza la leyenda para localizar las líneas coloreadas que representan el Modelo Ideal y el Modelo de Adivinación Aleatoria.

    Observará que el modelo TM_Decision_Tree ofrece el mayor impulso, superando el rendimiento tanto de los modelos de agrupación en clústeres como Naive Bayes.

Para obtener una explicación detallada de un gráfico de elevación similar al creado en esta lección, consulte Lift Chart (Analysis Services - Minería de datos).

Siguiente tarea de la lección

Prueba de un modelo filtrado (Tutorial básico de minería de datos)

Véase también

Gráfico de elevación (Analysis Services - Minería de datos)
Pestaña Gráfico de elevación (vista Gráfico de precisión de minería de datos)