Compartilhar via


AksServiceDeploymentConfiguration Classe

Representa informações de configuração de implantação para um serviço implantado no Serviço de Kubernetes do Azure.

Crie um objeto AksServiceDeploymentConfiguration usando o deploy_configuration método da AksWebservice classe.

Inicialize um objeto de configuração para implantar em um destino de computação do AKS.

Construtor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parâmetros

Nome Description
cpu_cores_limit
Obrigatório

O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal.

memory_gb_limit
Obrigatório

A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.

autoscale_enabled
Obrigatório

Indica se o dimensionamento automático deve ser habilitado para esse serviço Web. O padrão é True se num_replicas for None.

autoscale_min_replicas
Obrigatório
int

O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1.

autoscale_max_replicas
Obrigatório
int

O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10

autoscale_refresh_seconds
Obrigatório
int

Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.

autoscale_target_utilization
Obrigatório
int

A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70.

collect_model_data
Obrigatório

Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão.

auth_enabled
Obrigatório

Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True.

cpu_cores
Obrigatório

O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1

memory_gb
Obrigatório

A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5

enable_app_insights
Obrigatório

Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão

scoring_timeout_ms
Obrigatório
int

Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000.

replica_max_concurrent_requests
Obrigatório
int

O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
Obrigatório
int

O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.

num_replicas
Obrigatório
int

O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão.

primary_key
Obrigatório
str

Uma chave de autenticação primária a ser usada para este serviço Web.

secondary_key
Obrigatório
str

Uma chave de autenticação secundária a ser usada para este serviço Web.

tags
Obrigatório

Dicionário de marcas de valor de chave para fornecer esse serviço Web.

properties
Obrigatório

Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.

description
Obrigatório
str

Uma descrição para fornecer esse serviço Web.

gpu_cores
Obrigatório
int

O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0.

period_seconds
Obrigatório
int

A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Obrigatório
int

Número de segundos após o início do contêiner antes do início das investigações de atividade. O padrão é 310.

timeout_seconds
Obrigatório
int

Número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1.

success_threshold
Obrigatório
int

O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1.

failure_threshold
Obrigatório
int

Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará failureThreshold horários antes de desistir. O valor padrão é 3. O valor mínimo é 1.

namespace
Obrigatório
str

O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.

token_auth_enabled
Obrigatório

Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão.

cpu_cores_limit
Obrigatório

O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal.

memory_gb_limit
Obrigatório

A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.

blobfuse_enabled

Se deseja ou não habilitar o blobfuse para download de modelo para este serviço Web. Padrões como True

Valor padrão: None
autoscale_enabled
Obrigatório

Indica se o dimensionamento automático deve ser habilitado para esse serviço Web. O padrão é True se num_replicas for None.

autoscale_min_replicas
Obrigatório
int

O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1.

autoscale_max_replicas
Obrigatório
int

O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10

autoscale_refresh_seconds
Obrigatório
int

Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.

autoscale_target_utilization
Obrigatório
int

A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70.

collect_model_data
Obrigatório

Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão.

auth_enabled
Obrigatório

Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True.

cpu_cores
Obrigatório

O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1

memory_gb
Obrigatório

A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5

enable_app_insights
Obrigatório

Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão

scoring_timeout_ms
Obrigatório
int

Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000.

replica_max_concurrent_requests
Obrigatório
int

O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
Obrigatório
int

O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.

num_replicas
Obrigatório
int

O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão.

primary_key
Obrigatório
str

Uma chave de autenticação primária a ser usada para este serviço Web.

secondary_key
Obrigatório
str

Uma chave de autenticação secundária a ser usada para este serviço Web.

tags
Obrigatório

Dicionário de marcas de valor de chave para fornecer esse serviço Web.

properties
Obrigatório

Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.

description
Obrigatório
str

Uma descrição para fornecer esse serviço Web.

gpu_cores
Obrigatório
int

O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0.

period_seconds
Obrigatório
int

A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Obrigatório
int

Número de segundos após o início do contêiner antes do início das investigações de atividade. O padrão é 310.

timeout_seconds
Obrigatório
int

Número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1.

success_threshold
Obrigatório
int

O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1.

failure_threshold
Obrigatório
int

Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará failureThreshold horários antes de desistir. O valor padrão é 3. O valor mínimo é 1.

namespace
Obrigatório
str

O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.

token_auth_enabled
Obrigatório

Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão.

compute_target_name
Obrigatório
str

O nome do destino de computação para o qual implantar

cpu_cores_limit
Obrigatório

O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal.

memory_gb_limit
Obrigatório

A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.

blobfuse_enabled
Obrigatório

Se deseja ou não habilitar o blobfuse para download de modelo para este serviço Web. Padrões como True

Variáveis

Nome Description
autoscale_enabled

Indica se o dimensionamento automático deve ser habilitado para esse serviço Web. O padrão é True se num_replicas for None.

autoscale_min_replicas
int

O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1.

autoscale_max_replicas
int

O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10

autoscale_refresh_seconds
int

Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.

autoscale_target_utilization
int

A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70.

collect_model_data

Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão.

auth_enabled

Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True.

cpu_cores

O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1

memory_gb

A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5

enable_app_insights

Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão

scoring_timeout_ms
int

Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000.

replica_max_concurrent_requests
int

O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
int

O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.

num_replicas
int

O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão.

primary_key
str

Uma chave de autenticação primária a ser usada para este serviço Web.

secondary_key
str

Uma chave de autenticação secundária a ser usada para este serviço Web.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Dicionário de marcas de valor de chave para fornecer esse serviço Web.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Uma descrição para fornecer esse serviço Web.

gpu_cores
int

O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0.

period_seconds
int

A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
int

Número de segundos após o início do contêiner antes do início das investigações de atividade. O padrão é 310.

timeout_seconds
int

Número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1.

success_threshold
int

O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1.

failure_threshold
int

Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará failureThreshold horários antes de desistir. O valor padrão é 3. O valor mínimo é 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.

token_auth_enabled

Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão.

Métodos

print_deploy_configuration

Imprima a configuração de implantação.

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Gerará um WebserviceException se a validação falhar.

print_deploy_configuration

Imprima a configuração de implantação.

print_deploy_configuration()

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Gerará um WebserviceException se a validação falhar.

validate_configuration()

Exceções

Tipo Description