다음을 통해 공유


AksEndpoint 클래스

비고

이는 실험적 클래스이며 언제든지 변경 될 수 있습니다. 자세한 내용은 https://aka.ms/acr/connected-registry을 참조하세요.

Azure Kubernetes Service에서 실행되는 동일한 엔드포인트 뒤에 있는 웹 서비스 버전의 컬렉션을 나타냅니다.

단일 AksWebservice 점수 매기기 엔드포인트를 사용하여 단일 서비스를 배포하는 반면, AksEndpoint 클래스를 사용하면 동일한 점수 매기기 엔드포인트 뒤에 여러 웹 서비스 버전을 배포할 수 있습니다. 각 웹 서비스 버전은 트래픽의 백분율을 제공하도록 구성할 수 있으므로 A/B 테스트와 같이 제어된 방식으로 모델을 배포할 수 있습니다. AksEndpoint를 사용하면 AksWebservice와 유사한 모델 개체에서 배포할 수 있습니다.

Webservice 인스턴스를 초기화합니다.

Webservice 생성자는 제공된 작업 영역과 연결된 Webservice 개체의 클라우드 표현을 검색합니다. 검색된 Webservice 개체의 특정 형식에 해당하는 자식 클래스의 인스턴스를 반환합니다.

생성자

AksEndpoint(workspace, name)

매개 변수

Name Description
workspace
필수

검색할 Webservice 개체를 포함하는 작업 영역 개체입니다.

name
필수
str

검색할 Webservice 개체의 이름입니다.

변수

Name Description
versions

버전 개체에 대한 버전 이름의 사전입니다. 이 엔드포인트의 일부로 배포된 모든 버전을 포함합니다.

메서드

create_version

제공된 속성을 사용하여 엔드포인트에 새 버전을 추가합니다.

delete_version

엔드포인트에서 버전을 삭제합니다.

deploy_configuration

AKS 컴퓨팅 대상에 배포하기 위한 구성 개체를 만듭니다.

serialize

이 웹 서비스를 JSON 직렬화된 사전으로 변환합니다.

update

제공된 속성으로 엔드포인트를 업데이트합니다.

이 엔드포인트에서 None으로 남아 있는 값은 변경되지 않습니다.

update_version

제공된 속성을 사용하여 엔드포인트의 기존 버전을 업데이트합니다.

None으로 남아 있는 값은 이 버전에서 변경되지 않은 상태로 유지됩니다.

create_version

제공된 속성을 사용하여 엔드포인트에 새 버전을 추가합니다.

create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

매개 변수

Name Description
version_name
필수
str

엔드포인트에 추가할 버전의 이름입니다.

autoscale_enabled

엔드포인트에서 이 버전에 대해 자동 크기 조정을 사용하도록 설정할지 여부입니다. None인 경우 num_replicas 기본값은 True입니다.

Default value: None
autoscale_min_replicas
int

엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다.

Default value: None
autoscale_max_replicas
int

엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다.

Default value: None
autoscale_refresh_seconds
int

자동 크기 조정기가 엔드포인트에서 이 버전의 크기를 조정하려고 시도하는 빈도입니다. 기본값은 1입니다.

Default value: None
autoscale_target_utilization
int

대상 사용률(100점 만점)은 자동 크기 조정기가 엔드포인트에서 이 버전에 대해 유지 관리하려고 시도해야 합니다. 기본값은 70입니다.

Default value: None
collect_model_data

엔드포인트에서 이 버전에 대해 모델 데이터 수집을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

Default value: None
cpu_cores

엔드포인트에서 이 버전에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다.

Default value: None
memory_gb

엔드포인트에서 이 버전에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다.

Default value: None
scoring_timeout_ms
int

엔드포인트에서 이 버전에 대한 점수 매기기 호출을 적용하는 시간 제한입니다. 기본값은 60000입니다.

Default value: None
replica_max_concurrent_requests
int

엔드포인트에서 이 버전을 허용하는 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 구성원이 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요.

Default value: None
max_request_wait_time
int

503 오류를 반환하기 전에 요청이 큐에 유지되는 최대 시간(밀리초)입니다. 기본값은 500입니다.

Default value: None
num_replicas
int

엔드포인트에서 이 버전에 할당할 컨테이너 수입니다. 기본값이 아닙니다. 이 매개 변수가 설정되지 않은 경우 자동 크기 조정기는 기본적으로 사용하도록 설정됩니다.

Default value: None
tags

이 엔드포인트를 제공할 키 값 태그의 사전입니다.

Default value: None
properties

이 엔드포인트를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다.

Default value: None
description
str

이 엔드포인트를 제공하는 설명입니다.

Default value: None
models

업데이트된 서비스로 패키지할 모델 개체 목록입니다.

Default value: None
inference_config

필요한 모델 배포 속성을 제공하는 데 사용되는 InferenceConfig 개체입니다.

Default value: None
gpu_cores
int

엔드포인트에서 이 버전에 할당할 GPU 코어 수입니다. 기본값은 0입니다.

Default value: None
period_seconds
int

활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최소값은 1입니다.

Default value: None
initial_delay_seconds
int

활동성 프로브가 시작되기 전에 컨테이너가 시작된 후의 시간(초)입니다. 기본값은 310입니다.

Default value: None
timeout_seconds
int

활동성 프로브 시간이 초과된 후의 시간(초)입니다. 기본값은 2초입니다. 최소값은 1입니다.

Default value: None
success_threshold
int

활동성 프로브가 실패한 후 성공한 것으로 간주될 최소 연속 성공입니다. 기본값은 1입니다. 최소값은 1입니다.

Default value: None
failure_threshold
int

Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes에서 포기하기 전에 failureThreshold 시간을 시도합니다. 기본값은 3입니다. 최소값은 1입니다.

Default value: None
traffic_percentile

버전이 엔드포인트에서 사용하는 트래픽 양입니다.

Default value: None
is_default

엔드포인트에서 이 버전을 기본 버전으로 만들지 여부입니다. 기본값은 False입니다.

Default value: None
is_control_version_type

이 버전을 엔드포인트에서 컨트롤 버전으로 만들지 여부입니다. 기본값은 False입니다.

Default value: None
cpu_cores_limit

이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다.

Default value: None
memory_gb_limit

이 웹 서비스에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다.

Default value: None

예외

형식 Description

delete_version

엔드포인트에서 버전을 삭제합니다.

delete_version(version_name)

매개 변수

Name Description
version_name
필수
str

삭제할 엔드포인트의 버전 이름입니다.

예외

형식 Description

deploy_configuration

AKS 컴퓨팅 대상에 배포하기 위한 구성 개체를 만듭니다.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)

매개 변수

Name Description
autoscale_enabled

엔드포인트에서 이 버전에 대해 자동 크기 조정을 사용하도록 설정할지 여부입니다. None인 경우 num_replicas 기본값은 True입니다.

Default value: None
autoscale_min_replicas
int

엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다.

Default value: None
autoscale_max_replicas
int

엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다.

Default value: None
autoscale_refresh_seconds
int

자동 크기 조정기가 엔드포인트에서 이 버전의 크기를 조정하려고 시도하는 빈도입니다. 기본값은 1입니다.

Default value: None
autoscale_target_utilization
int

대상 사용률(100점 만점)은 자동 크기 조정기가 엔드포인트에서 이 버전에 대해 유지 관리하려고 시도해야 합니다. 기본값은 70입니다.

Default value: None
collect_model_data

엔드포인트에서 이 버전에 대해 모델 데이터 수집을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

Default value: None
auth_enabled

엔드포인트에서 이 버전에 대한 키 인증을 사용하도록 설정할지 여부입니다. 기본값은 True입니다.

Default value: None
cpu_cores

엔드포인트에서 이 버전에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다.

Default value: None
memory_gb

엔드포인트에서 이 버전에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다.

Default value: None
enable_app_insights

엔드포인트에서 이 버전에 대해 ApplicationInsights 로깅을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

Default value: None
scoring_timeout_ms
int

엔드포인트에서 이 버전에 대한 점수 매기기 호출을 적용하는 시간 제한입니다. 기본값은 60000입니다.

Default value: None
replica_max_concurrent_requests
int

엔드포인트에서 이 버전을 허용하는 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 구성원이 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요.

Default value: None
max_request_wait_time
int

503 오류를 반환하기 전에 요청이 큐에 유지되는 최대 시간(밀리초)입니다. 기본값은 500입니다.

Default value: None
num_replicas
int

엔드포인트에서 이 버전에 할당할 컨테이너 수입니다. 기본값이 아닙니다. 이 매개 변수가 설정되지 않은 경우 자동 크기 조정기는 기본적으로 사용하도록 설정됩니다.

Default value: None
primary_key
str

이 엔드포인트에 사용할 기본 인증 키입니다.

Default value: None
secondary_key
str

이 엔드포인트에 사용할 보조 인증 키입니다.

Default value: None
tags

이 엔드포인트를 제공할 키 값 태그의 사전입니다.

Default value: None
properties

이 엔드포인트를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다.

Default value: None
description
str

이 엔드포인트를 제공하는 설명입니다.

Default value: None
gpu_cores
int

엔드포인트에서 이 버전에 할당할 GPU 코어 수입니다. 기본값은 0입니다.

Default value: None
period_seconds
int

활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최소값은 1입니다.

Default value: None
initial_delay_seconds
int

활동성 프로브가 시작되기 전에 컨테이너가 시작된 후의 시간(초)입니다. 기본값은 310입니다.

Default value: None
timeout_seconds
int

활동성 프로브 시간이 초과된 후의 시간(초)입니다. 기본값은 2초입니다. 최소값은 1입니다.

Default value: None
success_threshold
int

활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최소값은 1입니다.

Default value: None
failure_threshold
int

Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes는 포기하기 전에 시간을 시도 failureThreshold 합니다. 기본값은 3입니다. 최소값은 1입니다.

Default value: None
namespace
str

이 엔드포인트를 배포할 Kubernetes 네임스페이스: 최대 63개의 소문자 영숫자('a'-'z', '0'-'9') 및 하이픈('-') 문자. 첫 번째 문자와 마지막 문자는 하이픈일 수 없습니다.

Default value: None
token_auth_enabled

이 엔드포인트에 대한 토큰 인증을 사용하도록 설정할지 여부입니다. 이 기능을 사용하도록 설정하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 엔드포인트에 액세스할 수 있습니다. 기본값은 False입니다.

Default value: None
version_name
str

엔드포인트에 있는 버전의 이름입니다.

Default value: None
traffic_percentile

버전이 엔드포인트에서 사용하는 트래픽 양입니다.

Default value: None
compute_target_name
str

배포할 컴퓨팅 대상의 이름

Default value: None
cpu_cores_limit

이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다.

Default value: None
memory_gb_limit

이 웹 서비스에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다.

Default value: None

반환

형식 Description

예외

형식 Description

serialize

이 웹 서비스를 JSON 직렬화된 사전으로 변환합니다.

serialize()

반환

형식 Description

이 웹 서비스의 JSON 표현입니다.

update

제공된 속성으로 엔드포인트를 업데이트합니다.

이 엔드포인트에서 None으로 남아 있는 값은 변경되지 않습니다.

update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)

매개 변수

Name Description
auth_enabled

엔드포인트에서 이 버전에 대한 키 인증을 사용하도록 설정할지 여부입니다. 기본값은 True입니다.

Default value: None
token_auth_enabled

이 엔드포인트에 대한 토큰 인증을 사용하도록 설정할지 여부입니다. 이 기능을 사용하도록 설정하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 엔드포인트에 액세스할 수 있습니다. 기본값은 False입니다.

Default value: None
enable_app_insights

엔드포인트에서 이 버전에 대해 Application Insights 로깅을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

Default value: None
description
str

이 엔드포인트를 제공하는 설명입니다.

Default value: None
tags

이 엔드포인트를 제공할 키 값 태그의 사전입니다.

Default value: None
properties

이 엔드포인트를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다.

Default value: None

예외

형식 Description

update_version

제공된 속성을 사용하여 엔드포인트의 기존 버전을 업데이트합니다.

None으로 남아 있는 값은 이 버전에서 변경되지 않은 상태로 유지됩니다.

update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

매개 변수

Name Description
version_name
필수
str

엔드포인트에 있는 버전의 이름입니다.

autoscale_enabled

엔드포인트에서 이 버전에 대해 자동 크기 조정을 사용하도록 설정할지 여부입니다. num_replicas None인 경우 기본값은 True입니다.

Default value: None
autoscale_min_replicas
int

엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다.

Default value: None
autoscale_max_replicas
int

엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다.

Default value: None
autoscale_refresh_seconds
int

자동 크기 조정기가 엔드포인트에서 이 버전의 크기를 조정하려고 시도하는 빈도입니다. 기본값은 1입니다.

Default value: None
autoscale_target_utilization
int

대상 사용률(100점 만점)은 자동 크기 조정기가 엔드포인트에서 이 버전에 대해 유지 관리하려고 시도해야 합니다. 기본값은 70입니다.

Default value: None
collect_model_data

엔드포인트에서 이 버전에 대해 모델 데이터 수집을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

Default value: None
cpu_cores

엔드포인트에서 이 버전에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다.

Default value: None
memory_gb

엔드포인트에서 이 버전에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다.

Default value: None
scoring_timeout_ms
int

엔드포인트에서 이 버전에 대한 점수 매기기 호출을 적용하는 시간 제한입니다. 기본값은 60000입니다.

Default value: None
replica_max_concurrent_requests
int

엔드포인트에서 이 버전을 허용하는 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 구성원이 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요.

Default value: None
max_request_wait_time
int

503 오류를 반환하기 전에 요청이 큐에 유지되는 최대 시간(밀리초)입니다. 기본값은 500입니다.

Default value: None
num_replicas
int

엔드포인트에서 이 버전에 할당할 컨테이너 수입니다. 기본값이 아닙니다. 이 매개 변수가 설정되지 않은 경우 자동 크기 조정기는 기본적으로 사용하도록 설정됩니다.

Default value: None
tags

이 엔드포인트를 제공할 키 값 태그의 사전입니다.

Default value: None
properties

이 엔드포인트를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다.

Default value: None
description
str

이 엔드포인트를 제공하는 설명

Default value: None
models

업데이트된 서비스를 사용하여 패키지할 Model 개체 목록

Default value: None
inference_config

필요한 모델 배포 속성을 제공하는 데 사용되는 InferenceConfig 개체입니다.

Default value: None
gpu_cores
int

엔드포인트에서 이 버전에 할당할 GPU 코어 수입니다. 기본값은 0입니다.

Default value: None
period_seconds
int

활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최소값은 1입니다.

Default value: None
initial_delay_seconds
int

활동성 프로브가 시작되기 전에 컨테이너가 시작된 후의 시간(초)입니다. 기본값은 310입니다.

Default value: None
timeout_seconds
int

활동성 프로브 시간이 초과된 후의 시간(초)입니다. 기본값은 2초입니다. 최소값은 1입니다.

Default value: None
success_threshold
int

활동성 프로브가 실패한 후 성공한 것으로 간주될 최소 연속 성공입니다. 기본값은 1입니다. 최소값은 1입니다.

Default value: None
failure_threshold
int

Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes에서 포기하기 전에 failureThreshold 시간을 시도합니다. 기본값은 3입니다. 최소값은 1입니다.

Default value: None
traffic_percentile

버전이 엔드포인트에서 사용하는 트래픽 양입니다.

Default value: None
is_default

엔드포인트에서 이 버전을 기본 버전으로 만들지 여부입니다. 기본값은 False입니다.

Default value: None
is_control_version_type

이 버전을 엔드포인트에서 컨트롤 버전으로 만들지 여부입니다. 기본값은 False입니다.

Default value: None
cpu_cores_limit

이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다.

Default value: None
memory_gb_limit

이 웹 서비스에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다.

Default value: None

예외

형식 Description