AksServiceDeploymentConfiguration Classe
Representa informações de configuração de implantação para um serviço implantado no Serviço de Kubernetes do Azure.
Crie um objeto AksServiceDeploymentConfiguration usando o deploy_configuration método da AksWebservice classe.
Inicialize um objeto de configuração para implantar em um destino de computação do AKS.
Construtor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parâmetros
| Nome | Description |
|---|---|
|
cpu_cores_limit
Obrigatório
|
O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal. |
|
memory_gb_limit
Obrigatório
|
A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal. |
|
autoscale_enabled
Obrigatório
|
Indica se o dimensionamento automático deve ser habilitado para esse serviço Web.
O padrão é True se |
|
autoscale_min_replicas
Obrigatório
|
O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1. |
|
autoscale_max_replicas
Obrigatório
|
O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10 |
|
autoscale_refresh_seconds
Obrigatório
|
Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1. |
|
autoscale_target_utilization
Obrigatório
|
A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70. |
|
collect_model_data
Obrigatório
|
Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão. |
|
auth_enabled
Obrigatório
|
Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True. |
|
cpu_cores
Obrigatório
|
O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1 |
|
memory_gb
Obrigatório
|
A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5 |
|
enable_app_insights
Obrigatório
|
Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão |
|
scoring_timeout_ms
Obrigatório
|
Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000. |
|
replica_max_concurrent_requests
Obrigatório
|
O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning. |
|
max_request_wait_time
Obrigatório
|
O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500. |
|
num_replicas
Obrigatório
|
O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão. |
|
primary_key
Obrigatório
|
Uma chave de autenticação primária a ser usada para este serviço Web. |
|
secondary_key
Obrigatório
|
Uma chave de autenticação secundária a ser usada para este serviço Web. |
|
tags
Obrigatório
|
Dicionário de marcas de valor de chave para fornecer esse serviço Web. |
|
properties
Obrigatório
|
Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados. |
|
description
Obrigatório
|
Uma descrição para fornecer esse serviço Web. |
|
gpu_cores
Obrigatório
|
O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0. |
|
period_seconds
Obrigatório
|
A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1. |
|
initial_delay_seconds
Obrigatório
|
Número de segundos após o início do contêiner antes do início das investigações de atividade. O padrão é 310. |
|
timeout_seconds
Obrigatório
|
Número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1. |
|
success_threshold
Obrigatório
|
O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1. |
|
failure_threshold
Obrigatório
|
Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará |
|
namespace
Obrigatório
|
O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens. |
|
token_auth_enabled
Obrigatório
|
Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão. |
|
cpu_cores_limit
Obrigatório
|
O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal. |
|
memory_gb_limit
Obrigatório
|
A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal. |
|
blobfuse_enabled
|
Se deseja ou não habilitar o blobfuse para download de modelo para este serviço Web. Padrões como True Valor padrão: None
|
|
autoscale_enabled
Obrigatório
|
Indica se o dimensionamento automático deve ser habilitado para esse serviço Web.
O padrão é True se |
|
autoscale_min_replicas
Obrigatório
|
O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1. |
|
autoscale_max_replicas
Obrigatório
|
O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10 |
|
autoscale_refresh_seconds
Obrigatório
|
Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1. |
|
autoscale_target_utilization
Obrigatório
|
A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70. |
|
collect_model_data
Obrigatório
|
Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão. |
|
auth_enabled
Obrigatório
|
Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True. |
|
cpu_cores
Obrigatório
|
O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1 |
|
memory_gb
Obrigatório
|
A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5 |
|
enable_app_insights
Obrigatório
|
Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão |
|
scoring_timeout_ms
Obrigatório
|
Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000. |
|
replica_max_concurrent_requests
Obrigatório
|
O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning. |
|
max_request_wait_time
Obrigatório
|
O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500. |
|
num_replicas
Obrigatório
|
O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão. |
|
primary_key
Obrigatório
|
Uma chave de autenticação primária a ser usada para este serviço Web. |
|
secondary_key
Obrigatório
|
Uma chave de autenticação secundária a ser usada para este serviço Web. |
|
tags
Obrigatório
|
Dicionário de marcas de valor de chave para fornecer esse serviço Web. |
|
properties
Obrigatório
|
Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados. |
|
description
Obrigatório
|
Uma descrição para fornecer esse serviço Web. |
|
gpu_cores
Obrigatório
|
O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0. |
|
period_seconds
Obrigatório
|
A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1. |
|
initial_delay_seconds
Obrigatório
|
Número de segundos após o início do contêiner antes do início das investigações de atividade. O padrão é 310. |
|
timeout_seconds
Obrigatório
|
Número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1. |
|
success_threshold
Obrigatório
|
O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1. |
|
failure_threshold
Obrigatório
|
Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará |
|
namespace
Obrigatório
|
O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens. |
|
token_auth_enabled
Obrigatório
|
Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão. |
|
compute_target_name
Obrigatório
|
O nome do destino de computação para o qual implantar |
|
cpu_cores_limit
Obrigatório
|
O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal. |
|
memory_gb_limit
Obrigatório
|
A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal. |
|
blobfuse_enabled
Obrigatório
|
Se deseja ou não habilitar o blobfuse para download de modelo para este serviço Web. Padrões como True |
Variáveis
| Nome | Description |
|---|---|
|
autoscale_enabled
|
Indica se o dimensionamento automático deve ser habilitado para esse serviço Web.
O padrão é True se |
|
autoscale_min_replicas
|
O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1. |
|
autoscale_max_replicas
|
O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10 |
|
autoscale_refresh_seconds
|
Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1. |
|
autoscale_target_utilization
|
A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70. |
|
collect_model_data
|
Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão. |
|
auth_enabled
|
Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True. |
|
cpu_cores
|
O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1 |
|
memory_gb
|
A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5 |
|
enable_app_insights
|
Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão |
|
scoring_timeout_ms
|
Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000. |
|
replica_max_concurrent_requests
|
O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning. |
|
max_request_wait_time
|
O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500. |
|
num_replicas
|
O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão. |
|
primary_key
|
Uma chave de autenticação primária a ser usada para este serviço Web. |
|
secondary_key
|
Uma chave de autenticação secundária a ser usada para este serviço Web. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.tags
|
Dicionário de marcas de valor de chave para fornecer esse serviço Web. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.properties
|
Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.description
|
Uma descrição para fornecer esse serviço Web. |
|
gpu_cores
|
O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0. |
|
period_seconds
|
A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1. |
|
initial_delay_seconds
|
Número de segundos após o início do contêiner antes do início das investigações de atividade. O padrão é 310. |
|
timeout_seconds
|
Número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1. |
|
success_threshold
|
O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1. |
|
failure_threshold
|
Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
|
O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens. |
|
token_auth_enabled
|
Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão. |
Métodos
| print_deploy_configuration |
Imprima a configuração de implantação. |
| validate_configuration |
Verifique se os valores de configuração especificados são válidos. Gerará um WebserviceException se a validação falhar. |
print_deploy_configuration
Imprima a configuração de implantação.
print_deploy_configuration()
validate_configuration
Verifique se os valores de configuração especificados são válidos.
Gerará um WebserviceException se a validação falhar.
validate_configuration()
Exceções
| Tipo | Description |
|---|---|