다음을 통해 공유


자습서: 개발 환경을 MLflow에 연결

이 페이지에서는 MLflow 실험을 만들고 개발 환경을 연결하는 방법을 보여 줍니다.

MLflow 실험은 GenAI 애플리케이션의 컨테이너입니다. 실험 데이터 모델 개념 가이드에서 MLflow 실험에 대해 자세히 알아봅니다.

개발 환경과 관련된 섹션으로 이동합니다.

로컬 개발 환경

1단계: MLflow 설치

Databricks 연결을 사용하여 MLflow를 설치합니다.

pip install --upgrade "mlflow[databricks]>=3.1"

2단계: MLflow 실험 만들기

  1. Databricks 작업 영역을 엽니다.
  2. 왼쪽 사이드바의 AI/ML 아래에서 실험을 클릭합니다.
  3. 실험 페이지의 맨 위에서 GenAI 앱 및 에이전트를 클릭합니다.

실험 만들기

3단계: 인증 구성

비고

이 단계에서는 Databricks 개인용 액세스 토큰을 사용하는 방법을 설명합니다. MLflow는 다른 Databricks 지원 인증 방법에서도 작동합니다.

다음 인증 방법 중 하나를 선택합니다.

환경 변수

  1. MLflow 실험에서 Kebab 메뉴 아이콘 Kebab 메뉴 아이콘을 클릭합니다.>로컬 >API 키 생성을 클릭합니다.
  2. 터미널에서 생성된 코드를 복사하고 실행합니다.
export DATABRICKS_TOKEN=<databricks-personal-access-token>
export DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
export MLFLOW_TRACKING_URI=databricks
export MLFLOW_REGISTRY_URI=databricks-uc
export MLFLOW_EXPERIMENT_ID=<experiment-id>

.env 파일

  1. MLflow 실험에서 Kebab 메뉴 아이콘 Kebab 메뉴 아이콘을 클릭합니다.>로컬 >API 키 생성을 클릭합니다.
  2. 생성된 코드를 프로젝트 루트의 .env 파일에 복사합니다.
DATABRICKS_TOKEN=<databricks-personal-access-token>
DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
MLFLOW_TRACKING_URI=databricks
MLFLOW_REGISTRY_URI=databricks-uc
MLFLOW_EXPERIMENT_ID=<experiment-id>
  1. python-dotenv 패키지를 설치합니다.
pip install python-dotenv
  1. 코드에서 환경 변수를 로드합니다.
# At the beginning of your Python script
from dotenv import load_dotenv

# Load environment variables from .env file
load_dotenv()

4단계: 연결 확인

테스트 파일을 만들고 이 코드를 실행하여 연결을 확인하고 MLflow 실험에 테스트 추적 을 기록합니다.

import mlflow
import os

experiment_id = os.environ.get("MLFLOW_EXPERIMENT_ID")
databricks_host = os.environ.get("DATABRICKS_HOST")
mlflow_tracking_uri = os.environ.get("MLFLOW_TRACKING_URI")

if experiment_id is None or databricks_host is None or mlflow_tracking_uri is None:
    raise Exception("Environment variables are not configured correctly.")

@mlflow.trace
def hello_mlflow(message: str):

    hello_data = {
        "experiment_url": f"{databricks_host}/mlflow/experiments/{experiment_id}",
        "experiment_name": mlflow.get_experiment(experiment_id=experiment_id).name,
        "message": message,
    }
    return hello_data

result = hello_mlflow("hello, world!")
print(result)

hello mlflow

Databricks에서 호스팅된 Notebook에서 개발

1단계: Notebook 만들기

Databricks Notebook을 만들면 GenAI 애플리케이션의 컨테이너인 MLflow 실험이 만들어집니다. 실험에 대한 자세한 내용은 데이터 모델을 참조하세요.

  1. Databricks 작업 영역을 엽니다.
  2. 왼쪽 사이드바 맨 위에 있는 새로 만들기로 이동합니다.
  3. 노트북을 클릭하세요.

2단계: MLflow 설치

Databricks 런타임에는 MLflow가 포함되지만 GenAI 기능을 사용하는 최상의 환경을 위해 최신 버전으로 업데이트합니다.

%pip install --upgrade "mlflow[databricks]>=3.1"
dbutils.library.restartPython()

3단계: 인증 구성

Databricks Notebook 내에서 작업하는 경우 추가 인증 구성이 필요하지 않습니다. Notebook은 작업 영역 및 관련 MLflow 실험에 자동으로 액세스할 수 있습니다.

4단계: 연결 확인

Notebook 셀에서 이 코드를 실행하여 연결을 확인합니다. Notebook 셀 아래에 MLflow 추적이 표시됩니다.

import mlflow
import os

@mlflow.trace
def hello_mlflow(message: str):
    hello_data = {
        "message": message,
    }
    return hello_data

result = hello_mlflow("hello, world!")
print(result)

hello mlflow Notebook 셀

다음 단계

참조 가이드

이 가이드의 개념 및 기능에 대한 자세한 내용은 다음을 참조하세요.