Compartir a través de


Esquema YAML del conjunto de características de la CLI (v2)

SE APLICA A:Extensión de ML de la CLI de Azure v2 (actual)

Nota:

La sintaxis de YAML que se detalla en este documento se basa en el esquema JSON de la versión más reciente de la extensión ML de la CLI v2. Se garantiza que esta sintaxis solo funciona con la versión más reciente de la extensión ML de la CLI v2. Dispone de los esquemas de las versiones de anteriores de la extensión en https://azuremlschemasprod.azureedge.net/.

Sintaxis de YAML

Clave Tipo Descripción Valores permitidos Valor predeterminado
$schema cuerda / cadena Esquema de YAML. Si usa la extensión de VS Code de Azure Machine Learning para crear el archivo YAML, la inclusión del elemento $schema en la parte superior del archivo le permite invocar las finalizaciones de los recursos y el esquema.
nombre cuerda / cadena Necesario. Nombre del conjunto de características.
Versión cuerda / cadena Necesario. Versión del conjunto de características.
descripción cuerda / cadena Descripción del conjunto de características.
especificación objeto Necesario. Especificación del conjunto de características.
specification.path cuerda / cadena Obligatorio Ruta de acceso a la carpeta de especificación del conjunto de características local.
entidades objeto (lista de cadenas) Necesario. Las entidades a las que está asociado este conjunto de características.
fase cuerda / cadena Fase del conjunto de características. Desarrollo, Producción, Archivado Desarrollo
etiquetas objeto Diccionario de etiquetas para el conjunto de características.
materialization_settings objeto Configuración de materialización del conjunto de características.
materialization_settings.offline_enabled booleano Indica si está habilitada la materialización de los valores de características en un almacenamiento sin conexión. Verdadero, Falso
materialization_settings.schedule objeto Programación de la materialización. Consulte Esquema YAML de programación de la CLI (v2).
materialization_settings.schedule.frequency cuerda / cadena Obligatorio si está configurada la programación. Enumeración para describir la frecuencia de una programación de periodicidad. Día, hora, minuto, semana, mes Día
materialization_settings.schedule.interval entero Obligatorio si está configurada la programación. Intervalo entre trabajos recurrentes.
materialization_settings.schedule.time_zone cuerda / cadena Zona horaria del desencadenador de la programación. UTC
materialization_settings.schedule.start_time cuerda / cadena Hora del desencadenador de la programación.
materialization_settings.notification objeto Configuración de la notificación de materialización.
materialization_settings.notification.email_on objeto (lista de cadenas) Obligatorio si está configurada la notificación. La notificación por correo electrónico se envía cuando el estado del trabajo coincide con esta configuración. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails objeto (lista de cadenas) Obligatorio si está configurada la notificación. Dirección de correo electrónico a la que se envía la notificación.
materialization_settings.resource objeto Recurso de proceso de Spark de Azure Machine Learning que se usa para el trabajo de materialización.
materialization_settings.resource.instance_type cuerda / cadena Tipo de la instancia de proceso de Spark de Azure Machine Learning. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3 Standard_E64s_v3. Consulte Limpieza y transformación de datos interactiva con Apache Spark en Azure Machine Learning (versión preliminar) para obtener una lista actualizada de los tipos admitidos.
materialization_settings.spark_configuration diccionario Diccionario de configuración de Spark

Observaciones

Se puede usar el comando az ml feature-set para administrar el conjunto de características.

Ejemplos

Hay ejemplos disponibles en el repositorio de GitHub de ejemplos. A continuación se muestran varios.

YAML: básico

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: con configuración de materialización

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Pasos siguientes