AksEndpointDeploymentConfiguration Classe
Observação
Esta é uma aula experimental, e pode mudar a qualquer momento. Consulte https://aka.ms/azuremlexperimental para obter mais informações.
Representa as informações de configuração de implantação para um serviço implantado no Serviço Kubernetes do Azure.
Crie um objeto AksEndpointDeploymentConfiguration usando o deploy_configuration método da AksEndpoint classe.
Inicialize um objeto de configuração para implantar um Endpoint em um destino de computação AKS.
Construtor
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
Parâmetros
| Name | Description |
|---|---|
|
autoscale_enabled
Necessário
|
Ativar ou não o dimensionamento automático para este WebService.
O padrão é True se |
|
autoscale_min_replicas
Necessário
|
O número mínimo de contêineres a serem usados ao dimensionar automaticamente este WebService. O padrão é 1. |
|
autoscale_max_replicas
Necessário
|
O número máximo de contêineres a serem usados ao dimensionar automaticamente este WebService. O valor padrão é 10. |
|
autoscale_refresh_seconds
Necessário
|
Com que frequência o autoscaler deve tentar dimensionar este WebService. O padrão é 1. |
|
autoscale_target_utilization
Necessário
|
A utilização alvo (em percentagem de 100) que o autoscaler deve tentar manter para este WebService. O padrão é 70. |
|
collect_model_data
Necessário
|
Se deve ou não habilitar a coleta de dados de modelo para este WebService. A definição padrão é 'False'. |
|
auth_enabled
Necessário
|
Habilitar ou não a autenticação para este WebService. O padrão é True. |
|
cpu_cores
Necessário
|
O número de núcleos de cpu a alocar para este WebService. Pode ser decimal. O padrão é 0,1 |
|
memory_gb
Necessário
|
A quantidade de memória (em GB) a alocar para este WebService. Pode ser decimal. O padrão é 0,5 |
|
enable_app_insights
Necessário
|
Habilitar ou não o log do Application Insights para este WebService. A definição padrão é 'False'. |
|
scoring_timeout_ms
Necessário
|
Um tempo limite a ser imposto para marcar chamadas para este WebService. O padrão é 60000. |
|
replica_max_concurrent_requests
Necessário
|
O número máximo de solicitações simultâneas por réplica para permitir esse WebService. O padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning. |
|
max_request_wait_time
Necessário
|
A quantidade máxima de tempo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500. |
|
num_replicas
Necessário
|
O número de contêineres a serem alocados para este WebService. Não há padrão, se esse parâmetro não estiver definido, o autoscaler será habilitado por padrão. |
|
primary_key
Necessário
|
Uma chave de autenticação primária a ser usada para este Webservice |
|
secondary_key
Necessário
|
Uma chave de autenticação secundária a ser usada para este Webservice |
|
tags
Necessário
|
Dicionário de tags de valor chave para dar a este Webservice |
|
properties
Necessário
|
Dicionário de propriedades de valor chave para fornecer este WebService. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados. |
|
description
Necessário
|
Uma descrição para fornecer este WebService. |
|
gpu_cores
Necessário
|
O número de núcleos de GPU a alocar para este WebService. O valor padrão é 0. |
|
period_seconds
Necessário
|
Com que frequência (em segundos) realizar a sonda de vivacidade. O padrão é de 10 segundos. O valor mínimo é 1. |
|
initial_delay_seconds
Necessário
|
O número de segundos após o início do recipiente antes que as sondas de vivacidade sejam iniciadas. O padrão é 310. |
|
timeout_seconds
Necessário
|
O número de segundos após os quais a sonda de vivacidade expira. O padrão é de 2 segundos. O valor mínimo é 1. |
|
success_threshold
Necessário
|
Os sucessos mínimos consecutivos para que a sonda de vivacidade seja considerada bem-sucedida depois de ter falhado. O padrão é 1. O valor mínimo é 1. |
|
failure_threshold
Necessário
|
Quando um Pod é iniciado e a sonda de vivacidade falha, o Kubernetes tentará |
|
namespace
Necessário
|
O namespace Kubernetes no qual implantar este WebService: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hífenes. |
|
token_auth_enabled
Necessário
|
Se deve ou não habilitar a autenticação do Azure Ative Directory para este WebService. Se isso estiver habilitado, os usuários poderão acessar esse Webservice buscando o token de acesso usando suas credenciais do Azure Ative Directory. A definição padrão é 'False'. |
|
version_name
Necessário
|
O nome da versão em um ponto de extremidade. |
|
traffic_percentile
Necessário
|
A quantidade de tráfego que a versão recebe em um ponto de extremidade. |
|
cpu_cores_limit
Necessário
|
O número máximo de núcleos de CPU que este Webservice tem permissão para usar. Pode ser decimal. |
|
memory_gb_limit
Necessário
|
A quantidade máxima de memória (em GB) que este Webservice tem permissão para usar. Pode ser decimal. |
|
autoscale_enabled
Necessário
|
Ativar ou não o dimensionamento automático para este WebService.
O padrão é True se |
|
autoscale_min_replicas
Necessário
|
O número mínimo de contêineres a serem usados ao dimensionar automaticamente este WebService. O padrão é 1. |
|
autoscale_max_replicas
Necessário
|
O número máximo de contêineres a serem usados ao dimensionar automaticamente este WebService. O valor padrão é 10. |
|
autoscale_refresh_seconds
Necessário
|
Com que frequência o autoscaler deve tentar dimensionar este WebService. O padrão é 1. |
|
autoscale_target_utilization
Necessário
|
A utilização alvo (em percentagem de 100) que o autoscaler deve tentar manter para este WebService. O padrão é 70. |
|
collect_model_data
Necessário
|
Se deve ou não habilitar a coleta de dados de modelo para este WebService. A definição padrão é 'False'. |
|
auth_enabled
Necessário
|
Habilitar ou não a autenticação para este WebService. O padrão é True. |
|
cpu_cores
Necessário
|
O número de núcleos de cpu a alocar para este WebService. Pode ser decimal. O padrão é 0,1 |
|
memory_gb
Necessário
|
A quantidade de memória (em GB) a alocar para este WebService. Pode ser decimal. O padrão é 0,5 |
|
enable_app_insights
Necessário
|
Habilitar ou não o log do Application Insights para este WebService. A definição padrão é 'False'. |
|
scoring_timeout_ms
Necessário
|
Um tempo limite a ser imposto para marcar chamadas para este WebService. O padrão é 60000. |
|
replica_max_concurrent_requests
Necessário
|
O número máximo de solicitações simultâneas por réplica para permitir esse WebService. O padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning. |
|
max_request_wait_time
Necessário
|
A quantidade máxima de tempo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500. |
|
num_replicas
Necessário
|
O número de contêineres a serem alocados para este WebService. Não há padrão, se esse parâmetro não estiver definido, o autoscaler será habilitado por padrão. |
|
primary_key
Necessário
|
Uma chave de autenticação primária a ser usada para este Webservice |
|
secondary_key
Necessário
|
Uma chave de autenticação secundária a ser usada para este Webservice |
|
tags
Necessário
|
Dicionário de tags de valor chave para dar a este Webservice |
|
properties
Necessário
|
Dicionário de propriedades de valor chave para fornecer este WebService. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados. |
|
description
Necessário
|
Uma descrição para fornecer este WebService. |
|
gpu_cores
Necessário
|
O número de núcleos de GPU a alocar para este WebService. O valor padrão é 0. |
|
period_seconds
Necessário
|
Com que frequência (em segundos) realizar a sonda de vivacidade. O padrão é de 10 segundos. O valor mínimo é 1. |
|
initial_delay_seconds
Necessário
|
O número de segundos após o início do recipiente antes que as sondas de vivacidade sejam iniciadas. O padrão é 310. |
|
timeout_seconds
Necessário
|
O número de segundos após os quais a sonda de vivacidade expira. O padrão é de 2 segundos. O valor mínimo é 1. |
|
success_threshold
Necessário
|
Os sucessos mínimos consecutivos para que a sonda de vivacidade seja considerada bem-sucedida depois de ter falhado. O padrão é 1. O valor mínimo é 1. |
|
failure_threshold
Necessário
|
Quando um Pod é iniciado e a sonda de vivacidade falha, o Kubernetes tentará |
|
namespace
Necessário
|
O namespace Kubernetes no qual implantar este WebService: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hífenes. |
|
token_auth_enabled
Necessário
|
Se deve ou não habilitar a autenticação do Azure Ative Directory para este WebService. Se isso estiver habilitado, os usuários poderão acessar esse Webservice buscando o token de acesso usando suas credenciais do Azure Ative Directory. A definição padrão é 'False'. |
|
version_name
Necessário
|
O nome da versão em um ponto de extremidade. |
|
traffic_percentile
Necessário
|
A quantidade de tráfego que a versão recebe em um ponto de extremidade. |
|
compute_target_name
Necessário
|
O nome do destino de computação a ser implantado |
|
cpu_cores_limit
Necessário
|
O número máximo de núcleos de CPU que este Webservice tem permissão para usar. Pode ser decimal. |
|
memory_gb_limit
Necessário
|
A quantidade máxima de memória (em GB) que este Webservice tem permissão para usar. Pode ser decimal. |
Variáveis
| Name | Description |
|---|---|
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
|
Ativar ou não o dimensionamento automático para este WebService. O padrão é True se |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
|
O número mínimo de contêineres a serem usados ao dimensionar automaticamente este WebService. O padrão é 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
|
O número máximo de contêineres a serem usados ao dimensionar automaticamente este WebService. O valor padrão é 10. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
|
Com que frequência o autoscaler deve tentar dimensionar este WebService. O padrão é 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
|
A utilização alvo (em percentagem de 100) que o autoscaler deve tentar manter para este WebService. O padrão é 70. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
|
Se deve ou não habilitar a coleta de dados de modelo para este WebService. A definição padrão é 'False'. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
|
Habilitar ou não a autenticação para este WebService. O padrão é True. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
|
O número de núcleos de cpu a alocar para este WebService. Pode ser decimal. O padrão é 0,1 |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
|
A quantidade de memória (em GB) a alocar para este WebService. Pode ser decimal. O padrão é 0,5 |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
|
Habilitar ou não o log do Application Insights para este WebService. A definição padrão é 'False'. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
|
Um tempo limite a ser imposto para marcar chamadas para este WebService. O padrão é 60000. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
|
O número máximo de solicitações simultâneas por réplica para permitir esse WebService. O padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
|
A quantidade máxima de tempo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
|
O número de contêineres a serem alocados para este WebService. Não há padrão, se esse parâmetro não estiver definido, o autoscaler será habilitado por padrão. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
|
Uma chave de autenticação primária a ser usada para este Webservice |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
|
Uma chave de autenticação secundária a ser usada para este Webservice |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
|
Dicionário de tags de valor chave para dar a este Webservice |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
|
Dicionário de propriedades de valor chave para fornecer este WebService. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
|
Uma descrição para fornecer este WebService. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
|
O número de núcleos de GPU a alocar para este WebService. O valor padrão é 0. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
|
Com que frequência (em segundos) realizar a sonda de vivacidade. O padrão é de 10 segundos. O valor mínimo é 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
|
O número de segundos após o início do recipiente antes que as sondas de vivacidade sejam iniciadas. O padrão é 310. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
|
O número de segundos após os quais a sonda de vivacidade expira. O padrão é de 2 segundos. O valor mínimo é 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
|
Os sucessos mínimos consecutivos para que a sonda de vivacidade seja considerada bem-sucedida depois de ter falhado. O padrão é 1. O valor mínimo é 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
|
Quando um Pod é iniciado e a sonda de vivacidade falha, o Kubernetes tentará |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
|
O namespace Kubernetes no qual implantar este WebService: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hífenes. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
|
Se deve ou não habilitar a autenticação do Azure Ative Directory para este WebService. Se isso estiver habilitado, os usuários poderão acessar esse Webservice buscando o token de acesso usando suas credenciais do Azure Ative Directory. A definição padrão é 'False'. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
|
O nome da versão em um ponto de extremidade. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
|
A quantidade de tráfego que a versão recebe em um ponto de extremidade. |
Métodos
| validate_endpoint_configuration |
Verifique se os valores de configuração especificados são válidos. Criará uma WebserviceException se a validação falhar. |
validate_endpoint_configuration
Verifique se os valores de configuração especificados são válidos.
Criará uma WebserviceException se a validação falhar.
validate_endpoint_configuration()
Exceções
| Tipo | Description |
|---|---|