AksServiceDeploymentConfiguration Classe

Representa informações de configuração de implantação para um serviço implantado no Serviço de Kubernetes do Azure.

Crie um objeto AksServiceDeploymentConfiguration usando o deploy_configuration método da AksWebservice classe.

Inicialize um objeto de configuração para implantar em um destino de computação do AKS.

Construtor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parâmetros

Nome	Description
cpu_cores_limit Obrigatório	O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal.
memory_gb_limit Obrigatório	A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.
autoscale_enabled Obrigatório	bool Indica se o dimensionamento automático deve ser habilitado para esse serviço Web. O padrão é True se `num_replicas` for None.
autoscale_min_replicas Obrigatório	int O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1.
autoscale_max_replicas Obrigatório	int O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10
autoscale_refresh_seconds Obrigatório	int Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.
autoscale_target_utilization Obrigatório	int A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70.
collect_model_data Obrigatório	bool Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão.
auth_enabled Obrigatório	bool Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True.
cpu_cores Obrigatório	float O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1
memory_gb Obrigatório	float A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5
enable_app_insights Obrigatório	bool Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão
scoring_timeout_ms Obrigatório	int Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000.
replica_max_concurrent_requests Obrigatório	int O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.
max_request_wait_time Obrigatório	int O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.
num_replicas Obrigatório	int O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão.
primary_key Obrigatório	str Uma chave de autenticação primária a ser usada para este serviço Web.
secondary_key Obrigatório	str Uma chave de autenticação secundária a ser usada para este serviço Web.
tags Obrigatório	dict[str, str] Dicionário de marcas de valor de chave para fornecer esse serviço Web.
properties Obrigatório	dict[str, str] Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.
description Obrigatório	str Uma descrição para fornecer esse serviço Web.
gpu_cores Obrigatório	int O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0.
period_seconds Obrigatório	int A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1.
initial_delay_seconds Obrigatório	int Número de segundos após o início do contêiner antes do início das investigações de atividade. O padrão é 310.
timeout_seconds Obrigatório	int Número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1.
success_threshold Obrigatório	int O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1.
failure_threshold Obrigatório	int Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará `failureThreshold` horários antes de desistir. O valor padrão é 3. O valor mínimo é 1.
namespace Obrigatório	str O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.
token_auth_enabled Obrigatório	bool Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão.
cpu_cores_limit Obrigatório	O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal.
memory_gb_limit Obrigatório	A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.
blobfuse_enabled	bool Se deseja ou não habilitar o blobfuse para download de modelo para este serviço Web. Padrões como True Valor padrão: None
autoscale_enabled Obrigatório	bool Indica se o dimensionamento automático deve ser habilitado para esse serviço Web. O padrão é True se `num_replicas` for None.
autoscale_min_replicas Obrigatório	int O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1.
autoscale_max_replicas Obrigatório	int O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10
autoscale_refresh_seconds Obrigatório	int Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.
autoscale_target_utilization Obrigatório	int A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70.
collect_model_data Obrigatório	bool Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão.
auth_enabled Obrigatório	bool Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True.
cpu_cores Obrigatório	float O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1
memory_gb Obrigatório	float A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5
enable_app_insights Obrigatório	bool Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão
scoring_timeout_ms Obrigatório	int Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000.
replica_max_concurrent_requests Obrigatório	int O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.
max_request_wait_time Obrigatório	int O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.
num_replicas Obrigatório	int O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão.
primary_key Obrigatório	str Uma chave de autenticação primária a ser usada para este serviço Web.
secondary_key Obrigatório	str Uma chave de autenticação secundária a ser usada para este serviço Web.
tags Obrigatório	dict[str, str] Dicionário de marcas de valor de chave para fornecer esse serviço Web.
properties Obrigatório	dict[str, str] Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.
description Obrigatório	str Uma descrição para fornecer esse serviço Web.
gpu_cores Obrigatório	int O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0.
period_seconds Obrigatório	int A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1.
initial_delay_seconds Obrigatório	int Número de segundos após o início do contêiner antes do início das investigações de atividade. O padrão é 310.
timeout_seconds Obrigatório	int Número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1.
success_threshold Obrigatório	int O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1.
failure_threshold Obrigatório	int Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará `failureThreshold` horários antes de desistir. O valor padrão é 3. O valor mínimo é 1.
namespace Obrigatório	str O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.
token_auth_enabled Obrigatório	bool Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão.
compute_target_name Obrigatório	str O nome do destino de computação para o qual implantar
cpu_cores_limit Obrigatório	float O número máximo de núcleos de cpu que este serviço Web tem permissão para usar. Pode ser um decimal.
memory_gb_limit Obrigatório	float A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.
blobfuse_enabled Obrigatório	bool Se deseja ou não habilitar o blobfuse para download de modelo para este serviço Web. Padrões como True

Variáveis

Nome	Description
autoscale_enabled	bool Indica se o dimensionamento automático deve ser habilitado para esse serviço Web. O padrão é True se `num_replicas` for None.
autoscale_min_replicas	int O número mínimo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O valor padrão é 1.
autoscale_max_replicas	int O número máximo de contêineres a serem usados ao dimensionar automaticamente esse serviço Web. O padrão é 10
autoscale_refresh_seconds	int Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.
autoscale_target_utilization	int A utilização de destino (em porcentagem de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O padrão é 70.
collect_model_data	bool Habilitar ou não a coleta de dados de modelo para este serviço Web. Usa False como padrão.
auth_enabled	bool Se deseja ou não habilitar a autenticação para este serviço Web. O padrão é True.
cpu_cores	float O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O padrão é 0.1
memory_gb	float A quantidade de memória (em GB) a ser alocada para esse serviço Web. Pode ser um decimal. O padrão é 0,5
enable_app_insights	bool Habilitar ou não o registro em log do Application Insights para esse serviço Web. Usa False como padrão
scoring_timeout_ms	int Um tempo limite a ser aplicado para a pontuação de chamadas para esse serviço Web. O padrão é 60000.
replica_max_concurrent_requests	int O número máximo de solicitações simultâneas por réplica para permitir esse serviço Web. O valor padrão é 1. Não altere essa configuração do valor padrão de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.
max_request_wait_time	int O tempo máximo que uma solicitação permanecerá na fila (em milissegundos) antes de retornar um erro 503. O padrão é 500.
num_replicas	int O número de contêineres a serem alocados para esse serviço Web. Sem padrão, se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão.
primary_key	str Uma chave de autenticação primária a ser usada para este serviço Web.
secondary_key	str Uma chave de autenticação secundária a ser usada para este serviço Web.
azureml.core.webservice.AksServiceDeploymentConfiguration.tags	Dicionário de marcas de valor de chave para fornecer esse serviço Web.
azureml.core.webservice.AksServiceDeploymentConfiguration.properties	Dicionário de propriedades de valor de chave para fornecer esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de valor de chave podem ser adicionados.
azureml.core.webservice.AksServiceDeploymentConfiguration.description	Uma descrição para fornecer esse serviço Web.
gpu_cores	int O número de núcleos de GPU a serem alocados para esse serviço Web. O valor padrão é 0.
period_seconds	int A frequência (em segundos) para realizar a investigação de atividade. Padrão para 10 segundos. O valor mínimo é 1.
initial_delay_seconds	int Número de segundos após o início do contêiner antes do início das investigações de atividade. O padrão é 310.
timeout_seconds	int Número de segundos após o qual a investigação de vida atinge o tempo limite. O padrão é 2 segundos. O valor mínimo é 1.
success_threshold	int O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1.
failure_threshold	int Quando um Pod é iniciado e a investigação de atividade falha, o Kubernetes tentará `failureThreshold` horários antes de desistir. O valor padrão é 3. O valor mínimo é 1.
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace	O namespace do Kubernetes no qual implantar esse serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.
token_auth_enabled	bool Se deseja ou não habilitar a autenticação do Azure Active Directory para esse serviço Web. Se isso estiver habilitado, os usuários poderão acessar esse serviço Web buscando o token de acesso usando suas credenciais do Azure Active Directory. Usa False como padrão.

Métodos

print_deploy_configuration

Imprima a configuração de implantação.

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Gerará um WebserviceException se a validação falhar.

print_deploy_configuration

Imprima a configuração de implantação.

print_deploy_configuration()

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Gerará um WebserviceException se a validação falhar.

validate_configuration()

Exceções

Tipo	Description
WebserviceException

Comentários

Esta página foi útil?

Compartilhar via

AksServiceDeploymentConfiguration Classe

Construtor

Parâmetros

Variáveis

Métodos

print_deploy_configuration

validate_configuration

Exceções

Comentários