다음을 통해 공유


Machine Learning용 Databricks Runtime

이 페이지에서는 Machine Learning용 Databricks 런타임에 대해 설명하고 이를 사용하는 클래식 컴퓨팅 리소스를 만드는 방법에 대한 지침을 제공합니다.

Machine Learning용 Databricks 런타임이란?

Machine Learning용 Databricks Runtime(Databricks Runtime ML)은 가장 일반적인 ML 및 DL 라이브러리를 포함하여 미리 빌드된 기계 학습 및 딥 러닝 인프라를 사용하여 컴퓨팅 리소스 만들기를 자동화합니다.

Databricks Runtime ML에 포함된 라이브러리

Databricks Runtime ML에는 널리 사용되는 다양한 ML 라이브러리가 포함되어 있습니다. 라이브러리는 새로운 기능과 수정 사항을 포함하도록 각 릴리스와 함께 업데이트됩니다.

Databricks는 지원되는 라이브러리의 하위 집합을 최상위 라이브러리로 지정했습니다. 이러한 라이브러리의 경우 Databricks는 각 런타임 릴리스를 사용하여 최신 패키지 릴리스로 업데이트하는 빠른 업데이트 주기를 제공합니다(종속성 충돌 금지). Databricks는 또한 최상위 라이브러리에 대한 고급 지원, 테스트 및 포함된 최적화를 제공합니다. 최상위 계층 라이브러리는 주 릴리스에서만 추가되거나 제거됩니다.

  • 최상위 계층 및 기타 제공된 라이브러리의 전체 목록은 Databricks Runtime ML에 대한 릴리스 정보를 참조하세요.
  • 라이브러리가 업데이트되는 빈도 및 라이브러리가 더 이상 사용되지 않는 시기에 대한 자세한 내용은 Databricks Runtime ML 유지 관리 정책참조하세요.

추가 라이브러리를 설치하여 Notebook 또는 컴퓨팅 리소스에 대한 사용자 지정 환경을 만들 수 있습니다.

Databricks Runtime for ML을 사용하여 컴퓨팅 리소스 만들기

ML용 Databricks Runtime을 사용하는 컴퓨팅 리소스를 만들려면 컴퓨팅 UI 만들기에서 Machine Learning 확인란을 선택합니다. 그러면 액세스 모드가 전용 사용자로 계정을 사용하여 Dedicated 로 자동으로 설정됩니다. 컴퓨팅 UI 만들기의 고급 섹션에서 다른 사용자 또는 그룹에 컴퓨팅 리소스를 수동으로 할당할 수 있습니다.

GPU 기반 컴퓨팅의 경우 작업자 유형 드롭다운 메뉴에서 GPU 사용 인스턴스 유형을 선택합니다. 지원되는 GPU 형식의 전체 목록은 지원되는 인스턴스 유형참조하세요.

Photon 및 Databricks Runtime ML

Databricks Runtime 15.2 ML 이상을 실행하는 컴퓨팅 리소스를 만들 때 Photon을 사용하도록 선택할 수 있습니다. Photon은 Spark SQL, Spark DataFrames, 기능 엔지니어링, GraphFrames 및 xgboost4j를 사용하여 애플리케이션의 성능을 향상시킵니다. Spark RDD, Pandas UDF 및 Python과 같은 비 JVM 언어를 사용하는 애플리케이션의 성능은 향상되지 않을 것으로 예상됩니다. 따라서 XGBoost, PyTorch 및 TensorFlow와 같은 Python 패키지는 Photon에서 향상된 기능을 볼 수 없습니다.

Spark RDD API 및 Spark MLlib는 Photon과의 호환성이 제한됩니다. Spark RDD 또는 Spark MLlib를 사용하여 큰 데이터 세트를 처리할 때 Spark 메모리 문제가 발생할 수 있습니다. Spark 메모리 문제를 참조하세요.

Databricks 런타임 ML에 대한 컴퓨팅 액세스 모드

Databricks Runtime ML을 실행하는 컴퓨팅 리소스에서 Unity 카탈로그의 데이터에 액세스하려면 액세스 모드를 전용으로 설정해야 합니다. 기계 학습 확인란을 선택하면 컴퓨팅 UI 만들기에서 액세스 모드가 자동으로 설정됩니다.

컴퓨팅 리소스에 전용 액세스 모드가 있는 경우 리소스를 단일 사용자 또는 그룹에 할당할 수 있습니다. 그룹에 할당된 사용자의 권한은 자동으로 그룹의 사용 권한 범위를 축소하여 사용자가 그룹의 다른 구성원과 리소스를 안전하게 공유할 수 있도록 합니다.

전용 액세스 모드를 사용하는 경우 다음 기능은 Databricks Runtime 15.4 LTS ML 이상에서만 사용할 수 있습니다.