적절한 컴퓨팅 대상 선택

완료됨

Azure Machine Learning에서 컴퓨팅 대상은 작업이 실행되는 물리적 컴퓨터 또는 가상 컴퓨터입니다.

사용 가능한 컴퓨팅 유형 이해

Azure Machine Learning은 실험, 학습 및 배포를 위해 여러 유형의 컴퓨팅을 지원합니다. 여러 유형의 컴퓨팅을 사용하면 요구 사항에 가장 적합한 컴퓨팅 대상 유형을 선택할 수 있습니다.

하이퍼 매개 변수 튜닝을 수행하여 서로 다른 모델을 생성한 여러 하이퍼 매개 변수 값의 다이어그램입니다.

  • 컴퓨팅 인스턴스: 가상 머신과 유사하게 동작하며 주로 Notebook을 실행하는 데 사용됩니다. 실험에 이상 적입니다.
  • 컴퓨팅 클러스터: 수요에 맞게 자동으로 확장 또는 축소되는 가상 머신의 다중 노드 클러스터입니다. 대량의 데이터를 처리해야 하는 스크립트를 실행하는 비용 효율적인 방법입니다. 클러스터를 사용하면 병렬 처리를 사용하여 워크로드를 분산하고 스크립트를 실행하는 데 걸리는 시간을 줄일 수 있습니다.
  • Kubernetes 클러스터: Kubernetes 기술을 기반으로 하는 클러스터를 사용하면 컴퓨팅이 구성되고 관리되는 방식을 보다 세분화할 수 있습니다. 클라우드 컴퓨팅용 AKS(자체 관리형 Azure Kubernetes) 클러스터 또는 온-프레미스 워크로드용 Arc Kubernetes 클러스터를 연결할 수 있습니다.
  • 연결된 컴퓨팅: Azure 가상 머신 또는 Azure Databricks 클러스터와 같은 기존 컴퓨팅을 작업 영역에 연결할 수 있습니다.
  • 서버리스 컴퓨팅: 학습 작업에 사용할 수 있는 완전 관리형 주문형 컴퓨팅입니다.

비고

Azure Machine Learning은 사용자 고유의 컴퓨팅을 만들고 관리하거나 Azure Machine Learning에서 완전히 관리되는 컴퓨팅을 사용하는 옵션을 제공합니다.

어떤 유형의 컴퓨팅을 사용해야 합니까?

일반적으로 컴퓨팅 대상을 사용할 때 수행할 수 있는 몇 가지 모범 사례가 있습니다. 적절한 컴퓨팅 유형을 선택하는 방법을 이해하기 위해 몇 가지 예제가 제공됩니다. 사용하는 컴퓨팅 유형은 항상 특정 상황에 따라 달라집니다.

실험에 대한 컴퓨팅 대상 선택

데이터 과학자이고 새로운 기계 학습 모델을 개발하라는 요청을 받고 있다고 상상해 보십시오. 실험할 수 있는 학습 데이터의 작은 하위 집합이 있을 수 있습니다.

실험 및 개발 중에는 Jupyter Notebook에서 작업하는 것이 좋습니다. Notebook 환경은 지속적으로 실행되는 컴퓨팅에서 가장 큰 이점을 제공합니다.

많은 데이터 과학자는 로컬 디바이스에서 Notebook을 실행하는 데 익숙합니다. Azure Machine Learning에서 관리하는 클라우드 대안은 컴퓨팅 인스턴스입니다. 또는 Spark의 분산 컴퓨팅 기능을 사용하려는 경우 Spark 서버리스 컴퓨팅 을 선택하여 Notebook에서 Spark 코드를 실행할 수도 있습니다.

프로덕션에 대한 컴퓨팅 대상 선택

실험 후에는 Python 스크립트를 실행하여 프로덕션을 준비하여 모델을 학습시킬 수 있습니다. 스크립트는 시간이 지남에 따라 지속적으로 모델을 다시 학습하려는 경우에 맞게 자동화하고 예약하는 것이 더 쉽습니다. 스크립트를 (파이프라인) 작업으로 실행할 수 있습니다.

프로덕션으로 이동할 때 컴퓨팅 대상이 대량의 데이터를 처리할 준비가 되도록 합니다. 더 많은 데이터를 사용할수록 기계 학습 모델이 향상될 가능성이 높습니다.

스크립트를 사용하여 모델을 학습할 때 주문형 컴퓨팅 대상을 원합니다. 컴퓨팅 클러스터는 스크립트를 실행해야 할 때 자동으로 확장되고 스크립트 실행이 완료되면 축소됩니다. 만들고 관리할 필요가 없는 대안을 원하는 경우 Azure Machine Learning의 서버리스 컴퓨팅을 사용할 수 있습니다.

배포를 위한 컴퓨팅 대상 선택

모델을 사용하여 예측을 생성하는 데 필요한 컴퓨팅 유형은 일괄 처리 또는 실시간 예측을 원하는지에 따라 달라집니다.

일괄 처리 예측의 경우 Azure Machine Learning에서 파이프라인 작업을 실행할 수 있습니다. 컴퓨팅 클러스터 및 Azure Machine Learning의 서버리스 컴퓨팅과 같은 컴퓨팅 대상은 주문형이며 확장성이 뛰어난 파이프라인 작업에 적합합니다.

실시간 예측을 원하는 경우 지속적으로 실행되는 컴퓨팅 유형이 필요합니다. 따라서 실시간 배포는 더 가볍고 비용 효율적인 컴퓨팅의 이점을 누릴 수 있습니다. 컨테이너는 실시간 배포에 적합합니다. 모델을 관리형 온라인 엔드포인트에 배포할 때 Azure Machine Learning은 모델을 실행할 컨테이너를 만들고 관리합니다. 또는 Kubernetes 클러스터를 연결하여 실시간 예측을 생성하는 데 필요한 컴퓨팅을 관리할 수 있습니다.