Compartir a través de


Lección 1: Creación de un modelo de minería de series temporales y una estructura de minería

En esta lección, creará un modelo de minería de datos que le permite predecir valores a lo largo del tiempo, en función de los datos históricos. Al crear el modelo, la estructura subyacente se generará automáticamente y se puede usar como base para otros modelos de minería de datos.

En esta lección se supone que está familiarizado con los modelos de previsión y con los requisitos del algoritmo de serie temporal de Microsoft. Para obtener más información, consulte Algoritmo de serie temporal de Microsoft.

CREATE MINING MODEL (instrucción)

Para crear un modelo de minería de datos directamente y generar automáticamente la estructura de minería de datos subyacente, use la instrucción CREATE MINING MODEL (DMX). El código en la instrucción se puede desglosar en las siguientes partes:

  • Asignar un nombre al modelo

  • Definición de la marca de tiempo

  • Definición de la columna de clave de serie opcional

  • Definición del atributo o atributos de predicción

A continuación se muestra un ejemplo genérico de la instrucción CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]  
(  
   <key columns>,  
   <predictable attribute columns>  
)  
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH  

La primera línea del código define el nombre del modelo de minería de datos:

CREATE MINING MODEL [Mining Model Name]  

Analysis Services genera automáticamente un nombre para la estructura subyacente, anexando "_structure" al nombre del modelo, lo que garantiza que el nombre de la estructura sea único del nombre del modelo. Para obtener información sobre cómo asignar un nombre a un objeto en DMX, vea Identificadores (DMX).

La siguiente línea del código define la columna clave para el modelo de minería de datos, que en el caso de un modelo de series temporales identifica de forma única un paso de tiempo en los datos de origen. El paso de tiempo se identifica con las palabras clave de KEY TIME después de los nombres de columna y los tipos de datos. Si el modelo de serie temporal tiene una clave de serie independiente, se identifica mediante la KEY palabra clave .

<key columns>  

La siguiente línea del código se usa para definir las columnas del modelo que se predecirán. Puede tener varios atributos de predicción en un único modelo de minería de datos. Cuando hay varios atributos de predicción, el algoritmo de serie temporal de Microsoft genera un análisis independiente para cada serie:

<predictable attribute columns>  

Tareas de la lección

Realizará las siguientes tareas en esta lección:

  • Creación de una consulta en blanco

  • Modificación de la consulta para crear el modelo de minería de datos

  • Ejecute la consulta.

Creación de la consulta

El primer paso es conectarse a una instancia de Analysis Services y crear una nueva consulta DMX en SQL Server Management Studio.

Para crear una nueva consulta DMX en SQL Server Management Studio

  1. Abre SQL Server Management Studio.

  2. En el cuadro de diálogo Conectar al servidor , en Tipo de servidor, seleccione Analysis Services. En Nombre del servidor, escriba LocalHosto el nombre de la instancia de Analysis Services a la que desea conectarse para esta lección. Haga clic en Conectar.

  3. En el Explorador de objetos, haga clic con el botón derecho en la instancia de Analysis Services, seleccione Nueva consulta y, a continuación, haga clic en DMX.

    Se abre el Editor de consultas y contiene una consulta nueva en blanco.

Modificación de la consulta

El siguiente paso consiste en modificar la instrucción CREATE MINING MODEL para crear el modelo de minería de datos que se usa para la previsión, junto con su estructura de minería de datos subyacente.

Para personalizar la instrucción CREATE MINING MODEL

  1. En el Editor de consultas, copie el ejemplo genérico de la instrucción CREATE MINING MODEL en la consulta en blanco.

  2. Reemplace lo siguiente:

    [mining model name]   
    

    con:

    [Forecasting_MIXED]  
    
  3. Reemplace lo siguiente:

    <key columns>  
    

    con:

    [Reporting Date] DATE KEY TIME,  
    [Model Region] TEXT KEY  
    

    La TIME KEY palabra clave indica que la columna ReportingDate contiene los valores de paso de hora usados para ordenar los valores. Los pasos de tiempo pueden ser fechas y horas, enteros o cualquier tipo de datos ordenado, siempre que los valores sean únicos y los datos se ordenan.

    Las TEXT palabras clave y KEY indican que la columna ModelRegion contiene una clave de serie adicional. Solo puede tener una clave de serie y los valores de la columna deben ser distintos.

  4. Reemplace lo siguiente:

    < predictable attribute columns> )  
    

    con:

    [Quantity] LONG CONTINUOUS PREDICT,  
    [Amount] DOUBLE CONTINUOUS PREDICT  
    )  
    
  5. Reemplace lo siguiente:

    USING <algorithm name>([parameter list])  
    WITH DRILLTHROUGH  
    

    con:

    USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    

    El parámetro de algoritmo , AUTO_DETECT_PERIODICITY = 0,8, indica que desea que el algoritmo detecte ciclos en los datos. Establecer este valor más cerca de 1 favorece la detección de muchos patrones, pero puede ralentizar el procesamiento.

    El parámetro de algoritmo, FORECAST_METHOD, indica si desea que los datos se analicen mediante ARTXP, ARIMA o una combinación de ambos.

    La palabra clave , WITH DRILLTHROUGHespecifique que desea poder ver estadísticas detalladas en los datos de origen una vez completado el modelo. Debe agregar esta cláusula si desea examinar el modelo mediante el Visor de series temporales de Microsoft. No es necesario para la predicción.

    La instrucción completa debe ser la siguiente:

    CREATE MINING MODEL [Forecasting_MIXED]  
         (  
        [Reporting Date] DATE KEY TIME,  
        [Model Region] TEXT KEY,  
        [Quantity] LONG CONTINUOUS PREDICT,  
        [Amount] DOUBLE CONTINUOUS PREDICT  
        )  
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    
    
  6. En el menú Archivo , haga clic en Guardar DMXQuery1.dmx Como.

  7. En el cuadro de diálogo Guardar como , vaya a la carpeta adecuada y asigne al archivo Forecasting_MIXED.dmxel nombre .

Ejecución de la consulta

El último paso es ejecutar la consulta. Después de crear y guardar una consulta, debe ejecutarse para crear el modelo de minería de datos y su estructura de minería de datos en el servidor. Para obtener más información sobre cómo ejecutar consultas en el Editor de consultas, vea Editor de consultas del motor de base de datos (SQL Server Management Studio) .

Para ejecutar la consulta

  • En el Editor de consultas, en la barra de herramientas, haga clic en Ejecutar.

    El estado de la consulta se muestra en la pestaña Mensajes de la parte inferior del Editor de consultas después de que la instrucción termine de ejecutarse. Los mensajes deben mostrar:

    Executing the query   
    Execution complete  
    

    Ahora existe una nueva estructura denominada Forecasting_MIXED_Structure en el servidor, junto con el modelo de minería de datos relacionado Forecasting_MIXED.

En la siguiente lección, agregará un modelo de minería a la estructura de minería Forecasting_MIXED que acaba de crear.

Lección siguiente

Lección 2: Agregar modelos de minería de datos a la estructura de serie temporal

Véase también

Contenido del modelo de minería de datos para modelos de serie temporal (Analysis Services - Minería de datos)
Referencia técnica del algoritmo de serie temporal de Microsoft