큐레이팅된 환경 탐색 및 사용
큐레이팅된 환경은 기본적으로 작업 영역에서 사용할 수 있는 가장 일반적인 기계 학습 워크로드에 대해 미리 빌드된 환경입니다.
큐레이팅된 환경은 AzureML 접두사를 사용하며 인기 있는 기계 학습 프레임워크 및 도구를 사용하는 스크립트를 제공하도록 설계되었습니다.
예를 들어 Scikit-Learn을 사용하여 회귀, 클러스터링 또는 분류 모델을 학습하는 스크립트를 실행하려는 경우의 큐레이팅된 환경이 있습니다.
큐레이팅된 환경을 탐색하려면 Azure CLI 또는 Python SDK를 사용하여 스튜디오에서 볼 수 있습니다.
다음 명령을 사용하면 Python SDK를 사용하여 큐레이팅된 환경의 설명 및 태그를 검색할 수 있습니다.
env = ml_client.environments.get("AzureML-sklearn-0.24-ubuntu18.04-py37-cpu", version=44)
print(env. description, env.tags)
큐레이팅된 환경 사용
스크립트를 (명령) 작업으로 실행하려고 할 때 가장 일반적으로 환경을 사용합니다.
스크립트를 실행하는 데 사용할 환경을 지정하려면 해당 이름과 버전별로 환경을 참조합니다.
예를 들어 다음 코드는 Scikit-Learn을 비롯한 큐레이팅된 환경을 사용하는 Python SDK를 사용하여 명령 작업을 구성하는 방법을 보여 줍니다.
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
display_name="train-with-curated-environment",
experiment_name="train-with-curated-environment"
)
# submit job
returned_job = ml_client.create_or_update(job)
큐레이팅된 환경 테스트 및 문제 해결
큐레이팅된 환경에서 배포 시간을 단축할 수 있으므로 미리 만들어진 큐레이팅된 환경 중 하나를 사용하여 코드를 실행할 수 있는지 먼저 살펴보는 것이 가장 좋습니다.
큐레이팅된 환경에 세부 정보를 검토하여 필요한 모든 패키지가 포함되어 있는지 확인할 수 있습니다. 그런 다음, 환경을 사용하여 스크립트를 실행하여 테스트할 수 있습니다.
환경에 코드를 실행하는 데 필요한 패키지가 모두 포함되어 있지 않으면 작업이 실패합니다.
작업이 실패하면 Azure Machine Learning 스튜디오에서 작업의 출력 + 로그 탭에서 자세한 오류 로그를 검토할 수 있습니다.
환경이 불완전하다는 일반적인 오류 메시지가 ModuleNotFoundError. 찾을 수 없는 모듈이 오류 메시지에 나열됩니다. 오류 메시지를 검토하여 코드를 실행하기 전에 필요한 패키지가 컴퓨팅 대상에 설치되도록 라이브러리를 포함하도록 환경을 업데이트할 수 있습니다.
다른 필요한 패키지를 지정해야 하는 경우 이러한 큐레이팅된 환경을 백업하는 Dockerfiles를 수정하여 큐레이팅된 환경을 사용자 고유의 사용자 지정 환경에 대한 참조로 사용할 수 있습니다.