이 페이지에서는 MLflow 실험을 만들고 개발 환경을 연결하는 방법을 보여 줍니다.
MLflow 실험은 GenAI 애플리케이션의 컨테이너입니다. 실험 데이터 모델 개념 가이드에서 MLflow 실험에 대해 자세히 알아봅니다.
개발 환경과 관련된 섹션으로 이동합니다.
로컬 개발 환경
1단계: MLflow 설치
Databricks 연결을 사용하여 MLflow를 설치합니다.
pip install --upgrade "mlflow[databricks]>=3.1"
2단계: MLflow 실험 만들기
- Databricks 작업 영역을 엽니다.
- 왼쪽 사이드바의 AI/ML 아래에서 실험을 클릭합니다.
- 실험 페이지의 맨 위에서 GenAI 앱 및 에이전트를 클릭합니다.
3단계: 인증 구성
비고
이 단계에서는 Databricks 개인용 액세스 토큰을 사용하는 방법을 설명합니다. MLflow는 다른 Databricks 지원 인증 방법에서도 작동합니다.
다음 인증 방법 중 하나를 선택합니다.
환경 변수
- MLflow 실험에서 Kebab 메뉴 아이콘
>로컬 >API 키 생성을 클릭합니다.
- 터미널에서 생성된 코드를 복사하고 실행합니다.
export DATABRICKS_TOKEN=<databricks-personal-access-token>
export DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
export MLFLOW_TRACKING_URI=databricks
export MLFLOW_REGISTRY_URI=databricks-uc
export MLFLOW_EXPERIMENT_ID=<experiment-id>
.env 파일
- MLflow 실험에서 Kebab 메뉴 아이콘
>로컬 >API 키 생성을 클릭합니다.
- 생성된 코드를 프로젝트 루트의
.env파일에 복사합니다.
DATABRICKS_TOKEN=<databricks-personal-access-token>
DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
MLFLOW_TRACKING_URI=databricks
MLFLOW_REGISTRY_URI=databricks-uc
MLFLOW_EXPERIMENT_ID=<experiment-id>
-
python-dotenv패키지를 설치합니다.
pip install python-dotenv
- 코드에서 환경 변수를 로드합니다.
# At the beginning of your Python script
from dotenv import load_dotenv
# Load environment variables from .env file
load_dotenv()
4단계: 연결 확인
테스트 파일을 만들고 이 코드를 실행하여 연결을 확인하고 MLflow 실험에 테스트 추적 을 기록합니다.
import mlflow
import os
experiment_id = os.environ.get("MLFLOW_EXPERIMENT_ID")
databricks_host = os.environ.get("DATABRICKS_HOST")
mlflow_tracking_uri = os.environ.get("MLFLOW_TRACKING_URI")
if experiment_id is None or databricks_host is None or mlflow_tracking_uri is None:
raise Exception("Environment variables are not configured correctly.")
@mlflow.trace
def hello_mlflow(message: str):
hello_data = {
"experiment_url": f"{databricks_host}/mlflow/experiments/{experiment_id}",
"experiment_name": mlflow.get_experiment(experiment_id=experiment_id).name,
"message": message,
}
return hello_data
result = hello_mlflow("hello, world!")
print(result)
Databricks에서 호스팅된 Notebook에서 개발
1단계: Notebook 만들기
Databricks Notebook을 만들면 GenAI 애플리케이션의 컨테이너인 MLflow 실험이 만들어집니다. 실험에 대한 자세한 내용은 데이터 모델을 참조하세요.
- Databricks 작업 영역을 엽니다.
- 왼쪽 사이드바 맨 위에 있는 새로 만들기로 이동합니다.
- 노트북을 클릭하세요.
2단계: MLflow 설치
Databricks 런타임에는 MLflow가 포함되지만 GenAI 기능을 사용하는 최상의 환경을 위해 최신 버전으로 업데이트합니다.
%pip install --upgrade "mlflow[databricks]>=3.1"
dbutils.library.restartPython()
3단계: 인증 구성
Databricks Notebook 내에서 작업하는 경우 추가 인증 구성이 필요하지 않습니다. Notebook은 작업 영역 및 관련 MLflow 실험에 자동으로 액세스할 수 있습니다.
4단계: 연결 확인
Notebook 셀에서 이 코드를 실행하여 연결을 확인합니다. Notebook 셀 아래에 MLflow 추적이 표시됩니다.
import mlflow
import os
@mlflow.trace
def hello_mlflow(message: str):
hello_data = {
"message": message,
}
return hello_data
result = hello_mlflow("hello, world!")
print(result)
다음 단계
- IDE(추적)를 사용하여 앱 계측 - 로컬 IDE에서 GenAI 앱에 MLflow 추적 추가
- 추적 기능으로 앱 계측하기(Notebook) - Databricks Notebook에 MLflow 추적 기능 추가
참조 가이드
이 가이드의 개념 및 기능에 대한 자세한 내용은 다음을 참조하세요.
- MLflow 실험 - GenAI 애플리케이션에 대한 실험 컨테이너 이해
- Databricks 인증 - 사용 가능한 모든 인증 방법 살펴보기
- 추적 개념 - MLflow 추적의 기본 사항 알아보기