Partilhar via


AksServiceDeploymentConfiguration Classe

Representa uma informação de configuração de implantação para um serviço implantado no Serviço Kubernetes do Azure.

Crie um objeto AksServiceDeploymentConfiguration usando o deploy_configuration método da AksWebservice classe.

Inicialize um objeto de configuração para implantação em um destino de computação AKS.

Construtor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parâmetros

Name Description
cpu_cores_limit
Necessário

O número máximo de núcleos de CPU que este Webservice tem permissão para usar. Pode ser decimal.

memory_gb_limit
Necessário

A quantidade máxima de memória (em GB) que este Webservice tem permissão para usar. Pode ser decimal.

autoscale_enabled
Necessário

Indica se o dimensionamento automático deve ser habilitado para este WebService. O padrão é True se num_replicas for None.

autoscale_min_replicas
Necessário
int

O número mínimo de contêineres a serem usados ao dimensionar automaticamente este WebService. O padrão é 1.

autoscale_max_replicas
Necessário
int

O número máximo de contêineres a serem usados ao dimensionar automaticamente este WebService. O padrão é 10

autoscale_refresh_seconds
Necessário
int

Com que frequência o autoscaler deve tentar dimensionar este WebService. O padrão é 1.

autoscale_target_utilization
Necessário
int

A utilização alvo (em percentagem de 100) que o autoscaler deve tentar manter para este WebService. O padrão é 70.

collect_model_data
Necessário

Se deve ou não habilitar a coleta de dados de modelo para este WebService. A definição padrão é 'False'.

auth_enabled
Necessário

Habilitar ou não a autenticação para este WebService. O padrão é True.

cpu_cores
Necessário

O número de núcleos de CPU a alocar para este WebService. Pode ser decimal. O padrão é 0,1

memory_gb
Necessário

A quantidade de memória (em GB) a alocar para este WebService. Pode ser decimal. O padrão é 0,5

enable_app_insights
Necessário

Habilitar ou não o log do Application Insights para este WebService. Padrão para False

scoring_timeout_ms
Necessário
int

Um tempo limite a ser imposto para marcar chamadas para este WebService. O padrão é 60000.

replica_max_concurrent_requests
Necessário
int

O número máximo de solicitações simultâneas por réplica para permitir esse WebService. O padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
Necessário
int

A quantidade máxima de tempo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.

num_replicas
Necessário
int

O número de contêineres a serem alocados para este WebService. Não há padrão, se esse parâmetro não estiver definido, o autoscaler será habilitado por padrão.

primary_key
Necessário
str

Uma chave de autenticação primária a ser usada para este WebService.

secondary_key
Necessário
str

Uma chave de autenticação secundária a ser usada para este WebService.

tags
Necessário

Dicionário de tags de valor chave para dar a este WebService.

properties
Necessário

Dicionário de propriedades de valor chave para fornecer este WebService. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.

description
Necessário
str

Uma descrição para fornecer este WebService.

gpu_cores
Necessário
int

O número de núcleos de GPU a alocar para este WebService. O valor padrão é 0.

period_seconds
Necessário
int

Com que frequência (em segundos) realizar a sonda de vivacidade. O padrão é de 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Necessário
int

Número de segundos após o início do recipiente antes que as sondas de vivacidade sejam iniciadas. O padrão é 310.

timeout_seconds
Necessário
int

Número de segundos após os quais a sonda de vivacidade expira. O padrão é de 2 segundos. O valor mínimo é 1.

success_threshold
Necessário
int

Sucessos consecutivos mínimos para que a sonda de vivacidade seja considerada bem-sucedida depois de ter falhado. O padrão é 1. O valor mínimo é 1.

failure_threshold
Necessário
int

Quando um Pod é iniciado e a sonda de vivacidade falha, o Kubernetes tentará failureThreshold momentos antes de desistir. O padrão é 3. O valor mínimo é 1.

namespace
Necessário
str

O namespace Kubernetes no qual implantar este WebService: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hífenes.

token_auth_enabled
Necessário

Se deve ou não habilitar a autenticação do Azure Ative Directory para este WebService. Se isso estiver habilitado, os usuários poderão acessar esse Webservice buscando o token de acesso usando suas credenciais do Azure Ative Directory. A definição padrão é 'False'.

cpu_cores_limit
Necessário

O número máximo de núcleos de CPU que este Webservice tem permissão para usar. Pode ser decimal.

memory_gb_limit
Necessário

A quantidade máxima de memória (em GB) que este Webservice tem permissão para usar. Pode ser decimal.

blobfuse_enabled

Se deve ou não habilitar o blobfuse para download de modelo para este WebService. O padrão é True

Default value: None
autoscale_enabled
Necessário

Indica se o dimensionamento automático deve ser habilitado para este WebService. O padrão é True se num_replicas for None.

autoscale_min_replicas
Necessário
int

O número mínimo de contêineres a serem usados ao dimensionar automaticamente este WebService. O padrão é 1.

autoscale_max_replicas
Necessário
int

O número máximo de contêineres a serem usados ao dimensionar automaticamente este WebService. O padrão é 10

autoscale_refresh_seconds
Necessário
int

Com que frequência o autoscaler deve tentar dimensionar este WebService. O padrão é 1.

autoscale_target_utilization
Necessário
int

A utilização alvo (em percentagem de 100) que o autoscaler deve tentar manter para este WebService. O padrão é 70.

collect_model_data
Necessário

Se deve ou não habilitar a coleta de dados de modelo para este WebService. A definição padrão é 'False'.

auth_enabled
Necessário

Habilitar ou não a autenticação para este WebService. O padrão é True.

cpu_cores
Necessário

O número de núcleos de CPU a alocar para este WebService. Pode ser decimal. O padrão é 0,1

memory_gb
Necessário

A quantidade de memória (em GB) a alocar para este WebService. Pode ser decimal. O padrão é 0,5

enable_app_insights
Necessário

Habilitar ou não o log do Application Insights para este WebService. Padrão para False

scoring_timeout_ms
Necessário
int

Um tempo limite a ser imposto para marcar chamadas para este WebService. O padrão é 60000.

replica_max_concurrent_requests
Necessário
int

O número máximo de solicitações simultâneas por réplica para permitir esse WebService. O padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
Necessário
int

A quantidade máxima de tempo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.

num_replicas
Necessário
int

O número de contêineres a serem alocados para este WebService. Não há padrão, se esse parâmetro não estiver definido, o autoscaler será habilitado por padrão.

primary_key
Necessário
str

Uma chave de autenticação primária a ser usada para este WebService.

secondary_key
Necessário
str

Uma chave de autenticação secundária a ser usada para este WebService.

tags
Necessário

Dicionário de tags de valor chave para dar a este WebService.

properties
Necessário

Dicionário de propriedades de valor chave para fornecer este WebService. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.

description
Necessário
str

Uma descrição para fornecer este WebService.

gpu_cores
Necessário
int

O número de núcleos de GPU a alocar para este WebService. O valor padrão é 0.

period_seconds
Necessário
int

Com que frequência (em segundos) realizar a sonda de vivacidade. O padrão é de 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Necessário
int

Número de segundos após o início do recipiente antes que as sondas de vivacidade sejam iniciadas. O padrão é 310.

timeout_seconds
Necessário
int

Número de segundos após os quais a sonda de vivacidade expira. O padrão é de 2 segundos. O valor mínimo é 1.

success_threshold
Necessário
int

Sucessos consecutivos mínimos para que a sonda de vivacidade seja considerada bem-sucedida depois de ter falhado. O padrão é 1. O valor mínimo é 1.

failure_threshold
Necessário
int

Quando um Pod é iniciado e a sonda de vivacidade falha, o Kubernetes tentará failureThreshold momentos antes de desistir. O padrão é 3. O valor mínimo é 1.

namespace
Necessário
str

O namespace Kubernetes no qual implantar este WebService: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hífenes.

token_auth_enabled
Necessário

Se deve ou não habilitar a autenticação do Azure Ative Directory para este WebService. Se isso estiver habilitado, os usuários poderão acessar esse Webservice buscando o token de acesso usando suas credenciais do Azure Ative Directory. A definição padrão é 'False'.

compute_target_name
Necessário
str

O nome do destino de computação a ser implantado

cpu_cores_limit
Necessário

O número máximo de núcleos de CPU que este Webservice tem permissão para usar. Pode ser decimal.

memory_gb_limit
Necessário

A quantidade máxima de memória (em GB) que este Webservice tem permissão para usar. Pode ser decimal.

blobfuse_enabled
Necessário

Se deve ou não habilitar o blobfuse para download de modelo para este WebService. O padrão é True

Variáveis

Name Description
autoscale_enabled

Indica se o dimensionamento automático deve ser habilitado para este WebService. O padrão é True se num_replicas for None.

autoscale_min_replicas
int

O número mínimo de contêineres a serem usados ao dimensionar automaticamente este WebService. O padrão é 1.

autoscale_max_replicas
int

O número máximo de contêineres a serem usados ao dimensionar automaticamente este WebService. O padrão é 10

autoscale_refresh_seconds
int

Com que frequência o autoscaler deve tentar dimensionar este WebService. O padrão é 1.

autoscale_target_utilization
int

A utilização alvo (em percentagem de 100) que o autoscaler deve tentar manter para este WebService. O padrão é 70.

collect_model_data

Se deve ou não habilitar a coleta de dados de modelo para este WebService. A definição padrão é 'False'.

auth_enabled

Habilitar ou não a autenticação para este WebService. O padrão é True.

cpu_cores

O número de núcleos de CPU a alocar para este WebService. Pode ser decimal. O padrão é 0,1

memory_gb

A quantidade de memória (em GB) a alocar para este WebService. Pode ser decimal. O padrão é 0,5

enable_app_insights

Habilitar ou não o log do Application Insights para este WebService. Padrão para False

scoring_timeout_ms
int

Um tempo limite a ser imposto para marcar chamadas para este WebService. O padrão é 60000.

replica_max_concurrent_requests
int

O número máximo de solicitações simultâneas por réplica para permitir esse WebService. O padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
int

A quantidade máxima de tempo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.

num_replicas
int

O número de contêineres a serem alocados para este WebService. Não há padrão, se esse parâmetro não estiver definido, o autoscaler será habilitado por padrão.

primary_key
str

Uma chave de autenticação primária a ser usada para este WebService.

secondary_key
str

Uma chave de autenticação secundária a ser usada para este WebService.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Dicionário de tags de valor chave para dar a este WebService.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Dicionário de propriedades de valor chave para fornecer este WebService. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Uma descrição para fornecer este WebService.

gpu_cores
int

O número de núcleos de GPU a alocar para este WebService. O valor padrão é 0.

period_seconds
int

Com que frequência (em segundos) realizar a sonda de vivacidade. O padrão é de 10 segundos. O valor mínimo é 1.

initial_delay_seconds
int

Número de segundos após o início do recipiente antes que as sondas de vivacidade sejam iniciadas. O padrão é 310.

timeout_seconds
int

Número de segundos após os quais a sonda de vivacidade expira. O padrão é de 2 segundos. O valor mínimo é 1.

success_threshold
int

Sucessos consecutivos mínimos para que a sonda de vivacidade seja considerada bem-sucedida depois de ter falhado. O padrão é 1. O valor mínimo é 1.

failure_threshold
int

Quando um Pod é iniciado e a sonda de vivacidade falha, o Kubernetes tentará failureThreshold momentos antes de desistir. O padrão é 3. O valor mínimo é 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

O namespace Kubernetes no qual implantar este WebService: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hífenes.

token_auth_enabled

Se deve ou não habilitar a autenticação do Azure Ative Directory para este WebService. Se isso estiver habilitado, os usuários poderão acessar esse Webservice buscando o token de acesso usando suas credenciais do Azure Ative Directory. A definição padrão é 'False'.

Métodos

print_deploy_configuration

Imprima a configuração de implantação.

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Criará uma WebserviceException se a validação falhar.

print_deploy_configuration

Imprima a configuração de implantação.

print_deploy_configuration()

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Criará uma WebserviceException se a validação falhar.

validate_configuration()

Exceções

Tipo Description