Compartir a través de


Aplicar funciones de predicción a un modelo

Para crear una consulta de predicción, primero debe seleccionar el modelo de minería de datos en el que se basará la consulta. Puede seleccionar cualquier modelo de minería de datos que exista en el proyecto actual.

Después de seleccionar un modelo, agregue una función de predicción a la consulta. Se importa comprender que las funciones de predicción se usan para muchos propósitos: sí, puede predecir valores, pero también puede obtener estadísticas relacionadas, así como información que se usó para generar la predicción. Las funciones de predicción pueden devolver los siguientes tipos de valores:

  • Nombre del atributo de predicción y el valor que se predice.

  • Estadísticas sobre la distribución y la varianza de los valores previstos.

  • Probabilidad de un resultado especificado o de todos los resultados posibles.

  • Las puntuaciones o valores superiores o inferiores.

  • Valores asociados a un nodo, objeto o atributo especificados.

Hay una amplia variedad de funciones de predicción que puede usar, pero debe elegir la función que se adapte al tipo de modelo que ha creado. Normalmente, esta opción depende del algoritmo usado para crear el modelo.

  • Para obtener una lista de las funciones de predicción compatibles con casi todos los tipos de modelo, consulte Funciones de predicción general (DMX).

  • Además, los algoritmos individuales admiten una variedad de funciones especializadas. Por ejemplo, si crea un modelo de minería de datos basado en el algoritmo de clústeres de Microsoft, puede usar funciones de predicción especializadas para buscar información sobre los clústeres, como la distancia desde un valor de datos al centroid del clúster.

    Para obtener ejemplos de cómo consultar un tipo específico de modelo de minería de datos, consulte el tema de referencia de algoritmos, en Algoritmos de minería de datos (Analysis Services - Minería de datos).

Elección de un modelo de minería de datos que se va a usar para la predicción

  1. En SQL Server Management Studio, haga clic con el botón derecho en el modelo y seleccione Compilar consulta de predicción.

    --O--

    En SQL Server Data Tools (SSDT), haga clic en la pestaña Predicción del modelo de minería de datos y, a continuación, haga clic en Seleccionar modelo en la tabla Modelo de minería de datos.

  2. En el cuadro de diálogo Seleccionar modelo de minería de datos, seleccione un modelo de minería de datos y, a continuación, haga clic en Aceptar.

    Puede elegir cualquier modelo dentro de la base de datos de Analysis Services actual. Para crear una consulta mediante un modelo en una base de datos diferente, debe abrir una nueva ventana de consulta en el contexto de esa base de datos o abrir el archivo de solución que contiene ese modelo.

Adición de funciones de predicción a una consulta

  1. En el Generador de consultas de predicción, configure los datos de entrada usados para la predicción, ya sea proporcionando valores en el cuadro de diálogo Entrada de consulta singleton o asignando el modelo a un origen de datos externo.

    Para obtener más información, vea Elegir y asignar datos de entrada para una consulta de predicción.

    Advertencia

    No es necesario proporcionar entradas para generar predicciones. Cuando no hay entradas, el algoritmo normalmente devolverá el valor que con mayor probabilidad se predice entre todas las posibles entradas.

  2. Haga clic en la columna Origen y elija un valor de la lista:

    <nombre del modelo> Seleccione esta opción para incluir valores del modelo de minería de datos en la salida. Solo puede agregar columnas predecibles.

    Al agregar una columna del modelo, el resultado devuelto es la lista no distinta de valores de esa columna.

    Las columnas que agregue con esta opción se incluyen en la parte SELECT de la instrucción DMX resultante.
    Función de predicción Seleccione esta opción para examinar una lista de funciones de predicción.

    Los valores o funciones que seleccione se agregan a la parte SELECT de la instrucción DMX resultante.

    La lista de funciones de predicción no está filtrada ni restringida por el tipo de modelo seleccionado. Por lo tanto, si tiene alguna duda sobre si la función es compatible con el tipo de modelo actual, simplemente puede agregar la función a la lista y ver si hay un error.

    Los elementos de lista precedidos por $ (como $AdjustedProbability) representan columnas de la tabla anidada que se genera cuando se usa la función , PredictHistogram. Estos son métodos abreviados que puede usar para devolver una sola columna y no una tabla anidada.
    Expresión personalizada Seleccione esta opción para escribir una expresión personalizada y, a continuación, asignar un alias a la salida.

    La expresión personalizada se agrega a la parte SELECT de la consulta de predicción DMX resultante.

    Esta opción es útil si desea agregar texto para la salida con cada fila, llamar a funciones vb o llamar a procedimientos almacenados personalizados.

    Para obtener información sobre el uso de funciones de VBA y Excel desde DMX, consulte Funciones de VBA en MDX y DAX.
  3. Después de agregar cada función o expresión, cambie a la vista DMX para ver cómo se agrega la función dentro de la instrucción DMX.

    Advertencia

    El Generador de consultas de predicción no valida DMX hasta que haga clic en Resultados. A menudo, encontrará que la expresión generada por el generador de consultas no es DMX válida. Las causas típicas hacen referencia a una columna que no está relacionada con la columna de predicción o intentan predecir una columna en una tabla anidada, lo que requiere una instrucción SUB-SELECT. En este momento, puede cambiar a la vista DMX y seguir editando la declaración.

Ejemplo: Creación de una consulta en un modelo de agrupación en clústeres

  1. Si no tiene un modelo de agrupación en clústeres disponible para compilar esta consulta de ejemplo, cree el modelo, [TM_Clustering], mediante el Tutorial básico de minería de datos.

  2. En SQL Server Management Studio, haga clic con el botón derecho en el modelo, [TM_Clustering] y seleccione Compilar consulta de predicción.

  3. En el menú Modelo de minería, seleccione Consulta individual.

  4. En el cuadro de diálogo Entrada de consulta singleton , establezca los valores siguientes como entradas:

    • Género = M

    • Distancia de viaje = 5-10 millas

  5. En la cuadrícula de consulta, en Origen, seleccione el modelo de minería TM_Clustering y agregue la columna [Bike Buyer].

  6. En Origen, seleccione Función de predicción y agregue la función , Cluster.

  7. En Origen, seleccione Función de predicción, agregue la función, PredictSupporty arrastre la columna de modelo [Bike Buyer] al cuadro Criterios/Argumento . Escriba Compatibilidad en la columna Alias .

    Copie la expresión que representa la función de predicción y la referencia de columna desde el cuadro Criterios/Argumento .

  8. En Origen, seleccione Expresión personalizada, escriba un alias y, a continuación, haga referencia a la función Excel CEILING mediante la sintaxis siguiente:

    Excel![CEILING](<arguments) as <return type>  
    

    Pega la referencia de columna como argumento de la función.

    Por ejemplo, la expresión siguiente devuelve el valor CEILING del valor de compatibilidad:

    EXCEL!CEILING(PredictSupport([TM_Clustering].[Bike Buyer]),2)  
    

    Escriba CEILING en la columna Alias .

  9. Haga clic en Cambiar a la vista de texto de consulta para revisar la instrucción DMX que se generó y, a continuación, haga clic en Cambiar a la vista de resultados de la consulta para ver las columnas que genera la consulta de predicción.

    En la tabla siguiente se muestran los resultados esperados:

    Comprador de Bicicletas $Cluster SOPORTE TÉCNICO TECHO
    0 Clúster 8 954 953.948638926372

Si desea agregar otras cláusulas en otra parte de la instrucción, por ejemplo, si desea agregar una cláusula WHERE, no puede agregarla mediante la cuadrícula; primero debe cambiar a la vista DMX.

Véase también

Consultas de minería de datos