비즈니스 문제 이해

완료됨

새로운 의료 앱을 개발하는 스타트업인 Proseware의 기계 학습 엔지니어라고 상상해 보세요. 데이터 과학자가 만든 당뇨병 분류 모델은 앱과 통합된 첫 번째 모델입니다. 더 큰 팀과 이야기한 후 목표는 웹 앱과 통합된 여러 모델을 갖는 것입니다.

당뇨병 분류 모델이 성공한 것으로 입증되면 Proseware는 실무자가 다양한 질병에 대한 환자를 더 빨리 진단할 수 있도록 더 많은 기계 학습 모델을 추가하려고 합니다. 모든 새 모델에 대해 데이터 과학 팀은 안전한 환경에서 실험할 수 있어야 합니다. 새 모델이 웹앱과 통합될 만큼 정확하면 웹앱에서 호출되는 엔드포인트에 배포하기 전에 테스트해야 합니다.

팀과 함께 다른 환경을 사용하는 것이 가장 좋다고 결정합니다.

  • 실험을 위한 개발.
  • 테스트 준비.
  • 프로덕션 엔드포인트에 모델을 배포하기 위한 프로덕션.

각 환경에 대해 별도의 Azure Machine Learning 작업 영역을 만듭니다. 각 환경에 대해 작업 영역을 별도로 유지하면 데이터 및 리소스를 보호할 수 있습니다. 예를 들어 개발 작업 영역에는 환자의 개인 데이터가 포함되지 않습니다. 또한 데이터 과학자는 실험 환경만 필요하고 프로덕션 코드 또는 리소스에 액세스할 필요가 없으므로 개발 작업 영역에만 액세스할 수 있습니다.

기계 학습 엔지니어는 데이터 과학자가 빌드하는 모든 것이 환경 간에 쉽게 이동되도록 해야 합니다. 새 모델을 배포할 준비가 되면 스테이징 환경에서 모델을 학습하고 테스트하려고 합니다. 코드, 모델, 배포를 테스트한 후 프로덕션 환경에서 모델을 배포하려고 합니다. 프로세스 속도를 높이기 위해 이 프로세스의 일부를 자동화할 수 있습니다.

환경에서 작업하려면 다음을 수행해야 합니다.

  • GitHub 리포지토리에서 환경을 만듭니다.
  • 각 Azure Machine Learning 작업 영역에 자격 증명을 GitHub의 환경 비밀로 저장합니다.
  • 제어된 승인을 위해 환경에 필요한 검토자를 추가합니다.
  • GitHub Actions 워크플로에서 환경을 사용합니다.