Azure Machine Learning 리소스 식별

완료됨

Azure Machine Learning의 리소스는 기계 학습 워크플로를 실행하는 데 필요한 인프라를 의미합니다. 관리자와 같은 사용자가 리소스를 만들고 관리하는 것이 가장 좋습니다.

Azure Machine Learning의 리소스는 다음과 같습니다.

  • 작업 공간
  • 컴퓨팅 리소스
  • 데이터 저장소

작업 영역 만들기 및 관리

작업 영역은 Azure Machine Learning의 최상위 리소스입니다. 데이터 과학자는 모델을 학습 및 추적하고 모델을 엔드포인트에 배포하기 위해 작업 영역에 액세스해야 합니다.

하지만 작업 영역에 대한 모든 권한이 있는 사용자에 유의해야 합니다. 컴퓨팅 리소스 및 데이터 저장소에 대한 참조 옆에 있는 작업 영역에서 코드의 모든 로그, 메트릭, 출력, 모델 및 스냅샷을 찾을 수 있습니다.

컴퓨팅 리소스 만들기 및 관리

모델을 학습하거나 배포할 때 필요한 가장 중요한 리소스 중 하나는 컴퓨팅입니다. Azure Machine Learning 작업 영역에는 다음 5가지 유형의 컴퓨팅이 있습니다.

  • 컴퓨팅 인스턴스: 클라우드의 가상 머신과 유사하며 작업 영역에서 관리합니다. (Jupyter) Notebook을 실행하는 개발 환경으로 사용하는 것이 좋습니다.
  • 컴퓨팅 클러스터: 클라우드의 CPU 또는 GPU 컴퓨팅 노드의 주문형 클러스터로, 작업 영역에서 관리합니다. 요구 사항에 맞게 자동으로 스케일링되므로 프로덕션 워크로드에 이상적입니다.
  • Kubernetes 클러스터: AKS(Azure Kubernetes Service) 클러스터를 만들거나 연결할 수 있습니다. 프로덕션 시나리오에서 학습된 기계 학습 모델을 배포하는 데 이상적입니다.
  • 연결된 컴퓨팅: Azure Databricks 또는 Synapse Spark 풀과 같은 다른 Azure 컴퓨팅 리소스를 작업 영역에 연결할 수 있습니다.
  • 서버리스 컴퓨팅: 학습 작업에 사용할 수 있는 완전 관리형 주문형 컴퓨팅입니다.

참고

Azure Machine Learning은 사용자를 위해 서버리스 컴퓨팅을 만들고 관리하므로 스튜디오의 컴퓨팅 페이지에는 나열되지 않습니다. 모델 학습에 서버리스 컴퓨팅을 사용하는 방법에 대해 자세히 알아보기

컴퓨팅은 기계 학습 워크로드를 사용할 때 가장 중요한 리소스이지만 비용이 가장 많이 들 수도 있습니다. 따라서 관리자만 컴퓨팅 리소스를 만들고 관리할 수 있도록 허용하는 것이 가장 좋습니다. 데이터 과학자는 컴퓨팅을 편집할 수 없지만 사용 가능한 컴퓨팅만 사용하여 워크로드를 실행할 수 있어야 합니다.

데이터 저장소 만들기 및 관리

작업 영역은 데이터 자체를 저장하지 않습니다. 대신 모든 데이터는 Azure 데이터 서비스에 대한 참조인 데이터 저장소에 저장됩니다. 데이터 저장소가 제공하는 데이터 서비스에 대한 연결 정보는 Azure Key Vault에 저장됩니다.

작업 영역을 만들면 Azure Storage 계정이 만들어지고 작업 영역에 자동으로 연결됩니다. 따라서 작업 영역에 4개의 데이터 저장소가 이미 추가되었습니다.

  • workspaceartifactstore: 작업 영역으로 만든 Azure Storage 계정의 azureml 컨테이너에 연결합니다. 작업을 실행할 때 컴퓨팅 및 실험 로그를 저장하는 데 사용됩니다.
  • workspaceworkingdirectory: 스튜디오의 Notebooks 섹션에서 사용하는 작업 영역으로 만든 Azure Storage 계정의 파일 공유에 연결합니다. 컴퓨팅 인스턴스에서 액세스하기 위해 파일이나 폴더를 업로드할 때마다 해당 파일이나 폴더가 이 파일 공유에 업로드됩니다.
  • workspaceblobstore: 작업 영역으로 만든 Azure Storage 계정의 Blob Storage에 연결합니다. 특히 azureml-blobstore-... 컨테이너입니다. 기본 데이터 저장소로 설정됩니다. 즉, 데이터 자산을 만들고 데이터를 업로드할 때마다 이 컨테이너에 데이터를 저장하게 됩니다.
  • workspacefilestore: 작업 영역으로 만든 Azure Storage 계정의 파일 공유에 연결합니다. 특히 azureml-filestore-... 파일 공유입니다.

추가로 다른 Azure 데이터 서비스에 연결할 데이터 저장소를 만들 수 있습니다. 대체로 데이터 저장소는 데이터 과학 프로젝트에서 가장 자주 사용되므로 Azure Storage 계정 또는 Azure Data Lake Storage(Gen2)에 연결됩니다.