Partilhar via


Esquema YAML do conjunto de recursos CLI (v2)

APLICA-SE A: Azure CLI ml extension v2 (atual)

Nota

A sintaxe YAML detalhada neste documento é baseada no esquema JSON para a versão mais recente da extensão ML CLI v2. Esta sintaxe é garantida apenas para funcionar com a versão mais recente da extensão ML CLI v2. Você pode encontrar os esquemas para versões de extensão mais antigas em https://azuremlschemasprod.azureedge.net/.

Sintaxe YAML

Chave Tipo Descrição Valores permitidos Valor predefinido
$schema corda O esquema YAML. Se você usar a extensão VS Code do Aprendizado de Máquina do Azure para criar o arquivo YAML, incluindo $schema na parte superior do arquivo permitirá que você invoque o esquema e a conclusão de recursos.
nome corda Obrigatório. Nome do conjunto de recursos.
versão corda Obrigatório. Versão do conjunto de recursos.
descrição corda Descrição do conjunto de recursos.
Especificação objeto Obrigatório. Especificação do conjunto de recursos.
especificação.caminho corda Caminho necessário para a pasta spec do conjunto de recursos local.
entidades objeto (lista de string) Obrigatório. As entidades às quais esse conjunto de recursos está associado.
estágio corda Cenário de configuração de recursos. Desenvolvimento, Produção, Arquivado Desenvolvimento
etiquetas objeto Dicionário de tags para o conjunto de recursos.
materialization_settings objeto Configuração de materialização do conjunto de recursos.
materialization_settings.offline_habilitado Booleano Se a materialização de valores de recurso em um armazenamento offline está habilitada. Verdadeiro, Falso
materialization_settings.horário objeto O cronograma de materialização. Consulte CLI (v2) agendar esquema YAML
materialization_settings.schedule.frequência corda Obrigatório se o agendamento estiver configurado. Enum para descrever a frequência de um esquema de recorrência. Dia, Hora, Minuto, Semana, Mês Dia
materialization_settings.schedule.interval número inteiro Obrigatório se o agendamento estiver configurado. O intervalo entre trabalhos recorrentes.
materialization_settings.schedule.time_zone corda O fuso horário de gatilho de agenda. UTC
materialization_settings.schedule.start_time corda O tempo de gatilho do cronograma.
materialization_settings.Notificação objeto A configuração da notificação de materialização.
materialization_settings.notification.email_on objeto (lista de string) Obrigatório se a notificação estiver configurada. A notificação por e-mail é enviada quando o status do trabalho corresponde a essa configuração. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails objeto (lista de string) Obrigatório se a notificação estiver configurada. O endereço de e-mail para o qual a notificação é enviada.
materialization_settings.resource objeto O recurso de computação do Azure Machine Learning Spark usado para o trabalho de materialização.
materialization_settings.resource.instance_type corda Tipo de instância de computação do Azure Machine Learning Spark. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3 Standard_E64s_v3. Consulte Interactive Data Wrangling with Apache Spark in Azure Machine Learning (visualização) para obter uma lista atualizada de tipos suportados.
materialization_settings.spark_configuration dicionário Dicionário de configuração do Spark

Observações

O az ml feature-set comando pode ser usado para gerenciar o conjunto de recursos.

Exemplos

Exemplos estão disponíveis no repositório GitHub de exemplos. Vários são mostrados abaixo.

YAML: básico

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: com configuração de materialização

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Próximos passos