솔루션 아키텍처 살펴보기

완료됨

규모와 자동화를 계획하기 위해 여러 관련자와 협력하여 MLOps(기계 학습 작업) 아키텍처를 결정했습니다.

기계 학습 작업 아키텍처의 다이어그램.

참고

다이어그램은 MLOps 아키텍처의 간소화된 표현입니다. 더 자세한 아키텍처를 보려면 MLOps(v2) 솔루션 가속기에서 다양한 사용 사례를 살펴봅니다.

아키텍처에는 다음이 포함됩니다.

  1. 설치: 솔루션에 필요한 모든 Azure 리소스를 만듭니다.
  2. 모델 개발(내부 루프): 모델을 학습하고 평가하기 위해 데이터를 탐색하고 처리합니다.
  3. 연속 통합: 모델을 패키지하고 등록합니다.
  4. 모델 배포(외부 루프): 모델을 배포합니다.
  5. 지속적인 배포: 모델을 테스트하고 프로덕션 환경으로 승격합니다.
  6. 모니터링: 모델 및 엔드포인트 성능을 모니터링합니다.

현재 과제의 가장 중요한 점은 모델 개발에서 모델 배포까지 모델을 사용하는 것입니다. 이러한 두 루프 간의 단계는 모델을 패키지하고 등록하는 것입니다. 데이터 과학 팀이 모델을 학습시킨 후에는 모델을 패키지하고 Azure Machine Learning 작업 영역에 등록해야 합니다. 모델이 등록되면 모델을 배포해야 합니다.

모델을 패키지하는 방법에는 여러 가지가 있습니다. 피클 파일 작업과 같은 몇 가지 옵션을 검토한 후 데이터 과학 팀과 함께 MLflow를 사용하기로 결정했습니다. 모델을 MLflow 모델로 등록하는 경우 Azure Machine Learning 작업 영역에서 코드 없는 배포를 선택할 수 있습니다. 코드 없는 배포를 사용하는 경우 배포가 작동하도록 채점 스크립트 및 환경을 만들 필요가 없습니다.

모델을 배포하려는 경우 실시간 예측을 위한 온라인 엔드포인트 또는 일괄 처리 예측을 위한 일괄 처리 엔드포인트 중에서 선택할 수 있습니다. 모델은 실무자가 직접적인 응답을 받을 것으로 예상되는 의료 데이터를 입력하는 웹앱과 통합되므로 모델을 온라인 엔드포인트에 배포하도록 선택합니다.

Azure Machine Learning 작업 영역에서 모델을 수동으로 배포할 수 있습니다. 그러나 앞으로 더 많은 모델을 배포할 것으로 예상합니다. 또한 모델이 다시 학습될 때마다 당뇨병 분류 모델을 쉽게 다시 배포하려고 합니다. 따라서 가능한 한 모델 배포를 자동화하려고 합니다.

참고

자동화는 MLOps의 중요한 측면이지만 휴먼 인 더 루프를 유지하는 것이 중요합니다. 모델을 자동으로 배포하기 전에 확인하는 것이 가장 좋습니다.