Freigeben über


AksEndpointDeploymentConfiguration Klasse

Hinweis

Dies ist eine experimentelle Klasse und kann sich jederzeit ändern. Weitere Informationen finden Sie unter https://aka.ms/azuremlexperimental.

Stellt Bereitstellungskonfigurationsinformationen für einen Dienst dar, der in Azure Kubernetes Service bereitgestellt wird.

Erstellen Sie ein AksEndpointDeploymentConfiguration-Objekt mithilfe deploy_configuration der Methode der AksEndpoint Klasse.

Initialisieren Eines Konfigurationsobjekts für die Bereitstellung eines Endpunkts in einem AKS-Computeziel.

Konstruktor

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Parameter

Name Beschreibung
autoscale_enabled
Erforderlich

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist "True", wenn num_replicas "None" ist.

autoscale_min_replicas
Erforderlich
int

Die Mindestanzahl der Container, die beim automatischenCaling dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

autoscale_max_replicas
Erforderlich
int

Die maximale Anzahl von Containern, die beim automatischenCaling dieses Webdiensts verwendet werden sollen. Standardwert ist 10.

autoscale_refresh_seconds
Erforderlich
int

Wie oft der Autoscaler versuchen sollte, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

autoscale_target_utilization
Erforderlich
int

Die Zielauslastung (in Prozent von 100) sollte der Autoscaler versuchen, diesen Webdienst beizubehalten. Der Standardwert ist 70.

collect_model_data
Erforderlich

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

auth_enabled
Erforderlich

Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

cpu_cores
Erforderlich

Die Anzahl der CPU-Kerne, die für diesen Webdienst zugewiesen werden sollen. Dies kann eine Dezimalzahl sein. Standardwert ist 0.1.

memory_gb
Erforderlich

Die Speichermenge (in GB), die für diesen Webdienst zugewiesen werden soll. Dies kann eine Dezimalzahl sein. Standardwert ist 0,5.

enable_app_insights
Erforderlich

Gibt an, ob die Application Insights-Protokollierung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

scoring_timeout_ms
Erforderlich
int

Ein Timeout zum Erzwingen von Bewertungsaufrufen für diesen Webdienst. Standardwert ist 60000.

replica_max_concurrent_requests
Erforderlich
int

Die Anzahl der maximalen gleichzeitigen Anforderungen pro Replikat, die für diesen Webdienst zulässig sind. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, der technische Support von Microsoft oder ein Mitglied des Azure Machine Learning-Teams.

max_request_wait_time
Erforderlich
int

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange (in Millisekunden) verbleibt, bevor ein 503-Fehler zurückgegeben wird. Standardwert ist 500.

num_replicas
Erforderlich
int

Die Anzahl der Container, die für diesen Webdienst zugewiesen werden sollen. Wenn dieser Parameter nicht festgelegt ist, ist der Autoscaler standardmäßig aktiviert.

primary_key
Erforderlich
str

Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

secondary_key
Erforderlich
str

Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

tags
Erforderlich

Wörterbuch der Schlüsselwerttags, die diesem Webservice zugewiesen werden sollen

properties
Erforderlich

Wörterbuch der Schlüsselwerteigenschaften, die diesem Webdienst zugewiesen werden sollen. Diese Eigenschaften können nach der Bereitstellung nicht geändert werden, aber neue Schlüsselwertpaare können hinzugefügt werden.

description
Erforderlich
str

Eine Beschreibung für diesen Webdienst.

gpu_cores
Erforderlich
int

Die Anzahl der GPU-Kerne, die für diesen Webdienst zugewiesen werden sollen. Standardmäßig auf 0 gesetzt.

period_seconds
Erforderlich
int

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

initial_delay_seconds
Erforderlich
int

Die Anzahl der Sekunden, nachdem der Container gestartet wurde, bevor Liveness-Probes initiiert werden. Standardwert ist 310.

timeout_seconds
Erforderlich
int

Die Anzahl der Sekunden, nach denen die Livenesssonde eine Zeitüberschreitung aufweist. Der Standardwert ist 2 Sekunde. Der Mindestwert ist 1.

success_threshold
Erforderlich
int

Die minimalen aufeinander folgenden Erfolge für die Livenesssonde, die nach einem Fehler als erfolgreich angesehen werden. Der Standardwert lautet 1. Der Mindestwert ist 1.

failure_threshold
Erforderlich
int

Wenn ein Pod startet und die Liveness-Probe fehlschlägt, versucht failureThreshold Kubernetes Mal, bevor er aufgibt. Der Standardwert ist 3. Der Mindestwert ist 1.

namespace
Erforderlich
str

Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Zeichen ('-'z', '0'-'9') und Bindestriche ('-'). Die ersten und letzten Zeichen dürfen keine Bindestriche sein.

token_auth_enabled
Erforderlich

Gibt an, ob Azure Active Directory-Authentifizierung für diesen Webdienst aktiviert werden soll. Wenn dies aktiviert ist, können Benutzer auf diesen Webdienst zugreifen, indem sie Zugriffstoken mithilfe ihrer Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.

version_name
Erforderlich
str

Der Name der Version in einem Endpunkt.

traffic_percentile
Erforderlich

Die Menge des Datenverkehrs, den die Version in einem Endpunkt benötigt.

cpu_cores_limit
Erforderlich

Die maximale Anzahl von CPU-Kernen, die dieser Webdienst verwenden darf. Dies kann eine Dezimalzahl sein.

memory_gb_limit
Erforderlich

Die maximale Arbeitsspeichermenge (in GB) dieses Webdiensts darf verwendet werden. Dies kann eine Dezimalzahl sein.

autoscale_enabled
Erforderlich

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist "True", wenn num_replicas "None" ist.

autoscale_min_replicas
Erforderlich
int

Die Mindestanzahl der Container, die beim automatischenCaling dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

autoscale_max_replicas
Erforderlich
int

Die maximale Anzahl von Containern, die beim automatischenCaling dieses Webdiensts verwendet werden sollen. Standardwert ist 10.

autoscale_refresh_seconds
Erforderlich
int

Wie oft der Autoscaler versuchen sollte, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

autoscale_target_utilization
Erforderlich
int

Die Zielauslastung (in Prozent von 100) sollte der Autoscaler versuchen, diesen Webdienst beizubehalten. Der Standardwert ist 70.

collect_model_data
Erforderlich

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

auth_enabled
Erforderlich

Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

cpu_cores
Erforderlich

Die Anzahl der CPU-Kerne, die für diesen Webdienst zugewiesen werden sollen. Dies kann eine Dezimalzahl sein. Standardwert ist 0.1.

memory_gb
Erforderlich

Die Speichermenge (in GB), die für diesen Webdienst zugewiesen werden soll. Dies kann eine Dezimalzahl sein. Standardwert ist 0,5.

enable_app_insights
Erforderlich

Gibt an, ob die Application Insights-Protokollierung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

scoring_timeout_ms
Erforderlich
int

Ein Timeout zum Erzwingen von Bewertungsaufrufen für diesen Webdienst. Standardwert ist 60000.

replica_max_concurrent_requests
Erforderlich
int

Die Anzahl der maximalen gleichzeitigen Anforderungen pro Replikat, die für diesen Webdienst zulässig sind. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, der technische Support von Microsoft oder ein Mitglied des Azure Machine Learning-Teams.

max_request_wait_time
Erforderlich
int

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange (in Millisekunden) verbleibt, bevor ein 503-Fehler zurückgegeben wird. Standardwert ist 500.

num_replicas
Erforderlich
int

Die Anzahl der Container, die für diesen Webdienst zugewiesen werden sollen. Wenn dieser Parameter nicht festgelegt ist, ist der Autoscaler standardmäßig aktiviert.

primary_key
Erforderlich
str

Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

secondary_key
Erforderlich
str

Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

tags
Erforderlich

Wörterbuch der Schlüsselwerttags, die diesem Webservice zugewiesen werden sollen

properties
Erforderlich

Wörterbuch der Schlüsselwerteigenschaften, die diesem Webdienst zugewiesen werden sollen. Diese Eigenschaften können nach der Bereitstellung nicht geändert werden, aber neue Schlüsselwertpaare können hinzugefügt werden.

description
Erforderlich
str

Eine Beschreibung für diesen Webdienst.

gpu_cores
Erforderlich
int

Die Anzahl der GPU-Kerne, die für diesen Webdienst zugewiesen werden sollen. Standardmäßig auf 0 gesetzt.

period_seconds
Erforderlich
int

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

initial_delay_seconds
Erforderlich
int

Die Anzahl der Sekunden, nachdem der Container gestartet wurde, bevor Liveness-Probes initiiert werden. Standardwert ist 310.

timeout_seconds
Erforderlich
int

Die Anzahl der Sekunden, nach denen die Livenesssonde eine Zeitüberschreitung aufweist. Der Standardwert ist 2 Sekunde. Der Mindestwert ist 1.

success_threshold
Erforderlich
int

Die minimalen aufeinander folgenden Erfolge für die Livenesssonde, die nach einem Fehler als erfolgreich angesehen werden. Der Standardwert lautet 1. Der Mindestwert ist 1.

failure_threshold
Erforderlich
int

Wenn ein Pod startet und die Liveness-Probe fehlschlägt, versucht failureThreshold Kubernetes Mal, bevor er aufgibt. Der Standardwert ist 3. Der Mindestwert ist 1.

namespace
Erforderlich
str

Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Zeichen ('-'z', '0'-'9') und Bindestriche ('-'). Die ersten und letzten Zeichen dürfen keine Bindestriche sein.

token_auth_enabled
Erforderlich

Gibt an, ob Azure Active Directory-Authentifizierung für diesen Webdienst aktiviert werden soll. Wenn dies aktiviert ist, können Benutzer auf diesen Webdienst zugreifen, indem sie Zugriffstoken mithilfe ihrer Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.

version_name
Erforderlich
str

Der Name der Version in einem Endpunkt.

traffic_percentile
Erforderlich

Die Menge des Datenverkehrs, den die Version in einem Endpunkt benötigt.

compute_target_name
Erforderlich
str

Der Name des Computeziels, für das bereitgestellt werden soll

cpu_cores_limit
Erforderlich

Die maximale Anzahl von CPU-Kernen, die dieser Webdienst verwenden darf. Dies kann eine Dezimalzahl sein.

memory_gb_limit
Erforderlich

Die maximale Arbeitsspeichermenge (in GB) dieses Webdiensts darf verwendet werden. Dies kann eine Dezimalzahl sein.

Variablen

Name Beschreibung
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist "True", wenn num_replicas "None" ist.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

Die Mindestanzahl der Container, die beim automatischenCaling dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

Die maximale Anzahl von Containern, die beim automatischenCaling dieses Webdiensts verwendet werden sollen. Standardwert ist 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Wie oft der Autoscaler versuchen sollte, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

Die Zielauslastung (in Prozent von 100) sollte der Autoscaler versuchen, diesen Webdienst beizubehalten. Der Standardwert ist 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

Die Anzahl der CPU-Kerne, die für diesen Webdienst zugewiesen werden sollen. Dies kann eine Dezimalzahl sein. Standardwert ist 0.1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

Die Speichermenge (in GB), die für diesen Webdienst zugewiesen werden soll. Dies kann eine Dezimalzahl sein. Standardwert ist 0,5.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Gibt an, ob die Application Insights-Protokollierung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

Ein Timeout zum Erzwingen von Bewertungsaufrufen für diesen Webdienst. Standardwert ist 60000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

Die Anzahl der maximalen gleichzeitigen Anforderungen pro Replikat, die für diesen Webdienst zulässig sind. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, der technische Support von Microsoft oder ein Mitglied des Azure Machine Learning-Teams.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange (in Millisekunden) verbleibt, bevor ein 503-Fehler zurückgegeben wird. Standardwert ist 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

Die Anzahl der Container, die für diesen Webdienst zugewiesen werden sollen. Wenn dieser Parameter nicht festgelegt ist, ist der Autoscaler standardmäßig aktiviert.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Wörterbuch der Schlüsselwerttags, die diesem Webservice zugewiesen werden sollen

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Wörterbuch der Schlüsselwerteigenschaften, die diesem Webdienst zugewiesen werden sollen. Diese Eigenschaften können nach der Bereitstellung nicht geändert werden, aber neue Schlüsselwertpaare können hinzugefügt werden.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

Eine Beschreibung für diesen Webdienst.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

Die Anzahl der GPU-Kerne, die für diesen Webdienst zugewiesen werden sollen. Standardmäßig auf 0 gesetzt.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

Die Anzahl der Sekunden, nachdem der Container gestartet wurde, bevor Liveness-Probes initiiert werden. Standardwert ist 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

Die Anzahl der Sekunden, nach denen die Livenesssonde eine Zeitüberschreitung aufweist. Der Standardwert ist 2 Sekunde. Der Mindestwert ist 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

Die minimalen aufeinander folgenden Erfolge für die Livenesssonde, die nach einem Fehler als erfolgreich angesehen werden. Der Standardwert lautet 1. Der Mindestwert ist 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

Wenn ein Pod startet und die Liveness-Probe fehlschlägt, versucht failureThreshold Kubernetes Mal, bevor er aufgibt. Der Standardwert ist 3. Der Mindestwert ist 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Zeichen ('-'z', '0'-'9') und Bindestriche ('-'). Die ersten und letzten Zeichen dürfen keine Bindestriche sein.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Gibt an, ob Azure Active Directory-Authentifizierung für diesen Webdienst aktiviert werden soll. Wenn dies aktiviert ist, können Benutzer auf diesen Webdienst zugreifen, indem sie Zugriffstoken mithilfe ihrer Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

Der Name der Version in einem Endpunkt.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

Die Menge des Datenverkehrs, den die Version in einem Endpunkt benötigt.

Methoden

validate_endpoint_configuration

Überprüfen Sie, ob die angegebenen Konfigurationswerte gültig sind.

Löst eine WebserviceException aus, wenn die Überprüfung fehlschlägt.

validate_endpoint_configuration

Überprüfen Sie, ob die angegebenen Konfigurationswerte gültig sind.

Löst eine WebserviceException aus, wenn die Überprüfung fehlschlägt.

validate_endpoint_configuration()

Ausnahmen

Typ Beschreibung