Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Na tej stronie pokazano, jak wdrożyć instrumentowane aplikacje GenAI w usłudze Databricks, aby ślady produkcji zostały przechwycone automatycznie.
Ślady są rejestrowane w eksperymencie MLflow na potrzeby wyświetlania w czasie rzeczywistym. Opcjonalnie przechowuj je przy użyciu tabel delty na potrzeby długoterminowego przechowywania. Zobacz Wdrażanie śledzonej aplikacji, aby porównać opcje wdrażania i rejestrowania śledzenia.
W przypadku aplikacji wdrożonych poza usługą Databricks zobacz Śledzenie agentów wdrożonych poza usługą Databricks.
Wdrażanie za pomocą platformy Agent Framework (zalecane)
Podczas wdrażania aplikacji GenAI za pomocą Mosaic AI Agent Framework, MLflow Tracing działa automatycznie bez dodatkowej konfiguracji. Ślady są przechowywane w eksperymencie MLflow agenta.
Kroki wdrażania
Najpierw skonfiguruj lokalizacje przechowywania dla śladów:
- Jeśli planujesz używać monitorowania produkcyjnego do przechowywania śladów w tabelach delty, upewnij się, że jest on włączony dla obszaru roboczego.
- Utwórz eksperyment MLflow na potrzeby przechowywania śladów produkcyjnych aplikacji.
Następnie w notesie języka Python instrumentacja agenta za pomocą śledzenia platformy MLflow i wdrażanie agenta za pomocą platformy Agent Framework:
- Zainstaluj w
mlflow[databricks]środowisku języka Python. Użyj najnowszej wersji. - Połącz się z eksperymentem MLflow przy użyciu polecenia
mlflow.set_experiment(...). - Opakuj kod agenta przy użyciu interfejsów tworzenia programu Agent Framework. W kodzie agenta włącz śledzenie MLflow przy użyciu instrumentacji automatycznej lub ręcznej .
- Zarejestruj agenta jako model MLflow i zarejestruj go w katalogu aparatu Unity.
- Upewnij się, że
mlflowznajduje się w zależnościach języka Python modelu z tą samą wersją pakietu używaną w środowisku notesu. - Służy
agents.deploy(...)do wdrażania modelu wykazu aparatu Unity (agenta) w punkcie końcowym obsługującym model.
Uwaga / Notatka
Jeśli wdrażasz agenta z notatnika przechowywanego w folderze Git usługi Databricks, śledzenie w czasie rzeczywistym w MLflow 3 nie działa domyślnie.
Aby włączyć śledzenie w czasie rzeczywistym, ustaw eksperyment jako niezwiązany z usługą Git, używając mlflow.set_experiment(), przed uruchomieniem agents.deploy().
Ślady agenta są teraz wyświetlane w eksperymencie MLflow w czasie rzeczywistym.
Przykładowy notatnik
W tym notesie przedstawiono powyższe kroki wdrażania.
Notes śledzenia platformy agenta i biblioteki MLflow
Wdrażanie przy użyciu niestandardowej obsługi procesora CPU (alternatywa)
Jeśli nie możesz użyć Agent Framework, wdróż swojego agenta przy użyciu niestandardowego serwowania modelu procesora CPU.
Najpierw skonfiguruj lokalizacje przechowywania dla śladów:
- Jeśli planujesz używać monitorowania produkcyjnego do przechowywania śladów w tabelach delty, upewnij się, że jest on włączony dla obszaru roboczego.
- Utwórz eksperyment MLflow na potrzeby przechowywania śladów produkcyjnych aplikacji.
Następnie w notesie języka Python instrumentacja agenta za pomocą śledzenia platformy MLflow i wdrażanie agenta za pomocą interfejsu użytkownika lub interfejsów API obsługującego model:
- Zarejestruj agenta jako model MLflow przy użyciu automatycznej lub ręcznej instrumentacji śledzenia.
- Wdróż model do obsługi procesora CPU.
- Aprowizuj jednostkę usługi lub osobisty token dostępu (PAT) z dostępem
CAN_EDITdo eksperymentu MLflow. - Na stronie Punktu końcowego obsługującego procesor CPU przejdź do pozycji "Edytuj punkt końcowy". Dla każdego wdrożonego modelu do śledzenia dodaj następujące zmienne środowiskowe:
ENABLE_MLFLOW_TRACING=trueMLFLOW_EXPERIMENT_ID=<ID of the experiment you created>- Jeśli aprowizowana została jednostka usługi, ustaw wartości
DATABRICKS_CLIENT_IDiDATABRICKS_CLIENT_SECRET. Jeśli aprowizowana została aprowizowana funkcja PAT, ustawDATABRICKS_HOSTiDATABRICKS_TOKEN.
Wyświetlanie śladów produkcji
Wyświetl ślady produkcyjne w interfejsie użytkownika eksperymentów MLflow. Ślady produkcji pokazują:
- Zapytania użytkownika i odpowiedzi agenta
- Opinie (kciuki w górę/w dół, komentarze)
- Współczynniki błędów i wzorce błędów
- Metryki opóźnienia i wydajności
- Użycie tokenu
Śledzenie dzienników w tabelach delty
Opcjonalnie śledź logi w tabelach Delta oprócz eksperymentu MLflow.
- Tabele monitorowania produkcji (zalecane): zadanie synchronizowania śladów z tabelą delty jest uruchamiane co ok. 15 minut. Nie trzeba włączać żadnych metryk monitorowania, aby te metryki działały. Ślady nie mają limitów rozmiaru.
- Tabele wnioskowania z obsługą bramy sztucznej inteligencji: włącz, edytując ustawienia bramy sztucznej inteligencji na stronie Punkt końcowy obsługujący model. Należy pamiętać o ograniczeniach dotyczących rozmiarów śledzenia i opóźnień synchronizacji śladów z tabelami.
Ograniczenia
Rejestrowanie śladów eksperymentów MLflow i tabel monitorowania w środowisku produkcyjnym wiąże się z limitami liczby śladów i szczytowego obciążenia. Jeśli musisz przechowywać więcej niż 100 000 śladów na eksperyment lub mieć szczytowe obciążenie > 60 zapytań na sekundę (QPS), użyj tego formularza , aby zażądać zwiększenia.
Dalsze kroki
- Dodawanie kontekstu do śladów — dołączanie metadanych do śledzenia żądań, sesji użytkowników i danych środowiska.
- Śledzenie użycia tokenu — monitorowanie użycia tokenu na potrzeby śledzenia kosztów.
- Monitorowanie produkcji — automatyczne ocenianie śladów za pomocą narzędzi oceniających.