Partager via


Schéma YAML de l’ensemble de fonctionnalités CLI (v2)

S’APPLIQUE À :Extension ml Azure CLI v2 (actuelle)

Remarque

La syntaxe YAML détaillée dans ce document est basée sur le schéma JSON pour la dernière version de l’extension ML CLI v2. Le fonctionnement de cette syntaxe est garanti uniquement avec la dernière version de l’extension ML CLI v2. Vous trouverez les schémas des versions d’extension plus anciennes sur https://azuremlschemasprod.azureedge.net/.

Syntaxe YAML

Clé Catégorie Descriptif Valeurs autorisées Valeur par défaut
$schema ficelle Schéma YAML. Si vous utilisez l’extension VS Code d’Azure Machine Learning afin de créer le fichier YAML, ajoutez $schema en haut de votre fichier pour appeler des complétions de schémas et de ressources.
nom ficelle Obligatoire. Nom de l’ensemble de fonctionnalités.
Version ficelle Obligatoire. Version de l’ensemble de fonctionnalités.
description ficelle Description de l’ensemble de fonctionnalités.
spécification objet Obligatoire. Spécification de l’ensemble de fonctionnalités.
specification.path ficelle Obligatoire Chemin du dossier local de spécification de l’ensemble de fonctionnalités.
Entités objet (liste de chaînes) Obligatoire. Entités auxquelles cet ensemble de fonctionnalités est associé.
phase ficelle Étape de l’ensemble de fonctionnalités. Développement, Production, Archivé Développement
étiquettes objet Dictionnaire des étiquettes de l’ensemble de fonctionnalités.
materialization_settings objet Paramètre de matérialisation de l’ensemble de fonctionnalités.
materialization_settings.offline_enabled booléen Indique si la matérialisation des valeurs de fonctionnalité dans un stockage hors connexion est activée. Vrai, Faux
materialization_settings.schedule objet Planification de la matérialisation. Consultez Schéma YAML de planification CLI (v2)
materialization_settings.schedule.frequency ficelle Obligatoire si la planification est configurée. Énumération qui décrit la fréquence d’une planification de périodicité. Jour, Heure, Minute, Semaine, Mois Jour
materialization_settings.schedule.interval entier Obligatoire si la planification est configurée. Intervalle entre les travaux récurrents.
materialization_settings.schedule.time_zone ficelle Fuseau horaire du déclencheur de planification. UTC
materialization_settings.schedule.start_time ficelle Heure du déclencheur de planification.
materialization_settings.notification objet Paramètre de notification de matérialisation.
materialization_settings.notification.email_on objet (liste de chaînes) Obligatoire si la notification est configurée. La notification par e-mail est envoyée quand l’état du travail correspond à ce paramètre. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails objet (liste de chaînes) Obligatoire si la notification est configurée. Adresse e-mail à laquelle la notification est envoyée.
materialization_settings.resource objet Ressource de calcul Spark Azure Machine Learning utilisée pour le travail de matérialisation.
materialization_settings.resource.instance_type ficelle Type d’instance de calcul Spark Azure Machine Learning. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Consultez Data Wrangling interactif avec Apache Spark dans Azure Machine Learning (préversion) pour obtenir la liste mise à jour des types pris en charge.
materialization_settings.spark_configuration dictionnaire dictionnaire de configuration spark

Notes

La commande az ml feature-set peut être utilisée pour gérer l’ensemble de fonctionnalités.

Exemples

Des exemples sont disponibles dans le référentiel d’exemples GitHub. Vous en trouverez plusieurs ci-dessous.

YAML : de base

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML : avec configuration de matérialisation

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Étapes suivantes