Compartilhar via


AksEndpointDeploymentConfiguration Classe

Observação

Esta é uma classe experimental e pode mudar a qualquer momento. Consulte https://aka.ms/azuremlexperimental para obter mais informações.

Representa informações de configuração de implantação para um serviço implantado no Serviço de Kubernetes do Azure.

Crie um objeto AksEndpointDeploymentConfiguration usando o deploy_configuration método da AksEndpoint classe.

Inicialize um objeto de configuração para implantar um ponto de extremidade em um destino de computação do AKS.

Construtor

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Parâmetros

Nome Description
autoscale_enabled
Obrigatório

Se deseja ou não habilitar o dimensionamento automático para este serviço Web. O padrão é True se num_replicas for None.

autoscale_min_replicas
Obrigatório
int

O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1.

autoscale_max_replicas
Obrigatório
int

O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10.

autoscale_refresh_seconds
Obrigatório
int

Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.

autoscale_target_utilization
Obrigatório
int

A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70.

collect_model_data
Obrigatório

Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão.

auth_enabled
Obrigatório

Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True.

cpu_cores
Obrigatório

O número de núcleos de cpu a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1

memory_gb
Obrigatório

A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5

enable_app_insights
Obrigatório

Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão.

scoring_timeout_ms
Obrigatório
int

Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000.

replica_max_concurrent_requests
Obrigatório
int

O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
Obrigatório
int

O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.

num_replicas
Obrigatório
int

O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão.

primary_key
Obrigatório
str

Uma chave de autenticação primária a ser usada para esse serviço Web

secondary_key
Obrigatório
str

Uma chave de autenticação secundária a ser usada para esse serviço Web

tags
Obrigatório

Dicionário de marcas de valor de chave para fornecer esse serviço Web

properties
Obrigatório

Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.

description
Obrigatório
str

Uma descrição para fornecer esse serviço Web.

gpu_cores
Obrigatório
int

O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0.

period_seconds
Obrigatório
int

A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Obrigatório
int

O número de segundos após o início do contêiner antes do início das investigações de vida. O padrão é 310.

timeout_seconds
Obrigatório
int

O número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1.

success_threshold
Obrigatório
int

Os mínimos sucessos consecutivos para que a investigação de vida seja considerada bem-sucedida após ter falhado. O valor padrão é 1. O valor mínimo é 1.

failure_threshold
Obrigatório
int

Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará failureThreshold horários antes de desistir. O valor padrão é 3. O valor mínimo é 1.

namespace
Obrigatório
str

O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.

token_auth_enabled
Obrigatório

Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão.

version_name
Obrigatório
str

O nome da versão em um ponto de extremidade.

traffic_percentile
Obrigatório

A quantidade de tráfego que a versão usa em um ponto de extremidade.

cpu_cores_limit
Obrigatório

O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal.

memory_gb_limit
Obrigatório

A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.

autoscale_enabled
Obrigatório

Se deseja ou não habilitar o dimensionamento automático para este serviço Web. O padrão é True se num_replicas for None.

autoscale_min_replicas
Obrigatório
int

O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1.

autoscale_max_replicas
Obrigatório
int

O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10.

autoscale_refresh_seconds
Obrigatório
int

Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.

autoscale_target_utilization
Obrigatório
int

A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70.

collect_model_data
Obrigatório

Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão.

auth_enabled
Obrigatório

Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True.

cpu_cores
Obrigatório

O número de núcleos de cpu a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1

memory_gb
Obrigatório

A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5

enable_app_insights
Obrigatório

Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão.

scoring_timeout_ms
Obrigatório
int

Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000.

replica_max_concurrent_requests
Obrigatório
int

O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
Obrigatório
int

O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.

num_replicas
Obrigatório
int

O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão.

primary_key
Obrigatório
str

Uma chave de autenticação primária a ser usada para esse serviço Web

secondary_key
Obrigatório
str

Uma chave de autenticação secundária a ser usada para esse serviço Web

tags
Obrigatório

Dicionário de marcas de valor de chave para fornecer esse serviço Web

properties
Obrigatório

Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.

description
Obrigatório
str

Uma descrição para fornecer esse serviço Web.

gpu_cores
Obrigatório
int

O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0.

period_seconds
Obrigatório
int

A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Obrigatório
int

O número de segundos após o início do contêiner antes do início das investigações de vida. O padrão é 310.

timeout_seconds
Obrigatório
int

O número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1.

success_threshold
Obrigatório
int

Os mínimos sucessos consecutivos para que a investigação de vida seja considerada bem-sucedida após ter falhado. O valor padrão é 1. O valor mínimo é 1.

failure_threshold
Obrigatório
int

Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará failureThreshold horários antes de desistir. O valor padrão é 3. O valor mínimo é 1.

namespace
Obrigatório
str

O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.

token_auth_enabled
Obrigatório

Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão.

version_name
Obrigatório
str

O nome da versão em um ponto de extremidade.

traffic_percentile
Obrigatório

A quantidade de tráfego que a versão usa em um ponto de extremidade.

compute_target_name
Obrigatório
str

O nome do destino de computação para o qual implantar

cpu_cores_limit
Obrigatório

O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal.

memory_gb_limit
Obrigatório

A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.

Variáveis

Nome Description
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Se deseja ou não habilitar o dimensionamento automático para este serviço Web. O padrão é True se num_replicas for None.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

O número de núcleos de cpu a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

Uma chave de autenticação primária a ser usada para esse serviço Web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

Uma chave de autenticação secundária a ser usada para esse serviço Web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Dicionário de marcas de valor de chave para fornecer esse serviço Web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

Uma descrição para fornecer esse serviço Web.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

O número de segundos após o início do contêiner antes do início das investigações de vida. O padrão é 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

O número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

Os mínimos sucessos consecutivos para que a investigação de vida seja considerada bem-sucedida após ter falhado. O valor padrão é 1. O valor mínimo é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará failureThreshold horários antes de desistir. O valor padrão é 3. O valor mínimo é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

O nome da versão em um ponto de extremidade.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

A quantidade de tráfego que a versão usa em um ponto de extremidade.

Métodos

validate_endpoint_configuration

Verifique se os valores de configuração especificados são válidos.

Gerará um WebserviceException se a validação falhar.

validate_endpoint_configuration

Verifique se os valores de configuração especificados são válidos.

Gerará um WebserviceException se a validação falhar.

validate_endpoint_configuration()

Exceções

Tipo Description