Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
W tym przewodniku przedstawiono sposób używania interfejsu użytkownika platformy Spark do diagnozowania problemów z kosztami i wydajnością. Jest to przewodnik krok po kroku i praktyczna instrukcja. Zamiast po prostu dostarczać wyjaśnienie, co robi każda strona w interfejsie użytkownika platformy Spark, informuje o tym, co należy szukać i co to znaczy. Jeśli nie znasz pojęć dotyczących sterowników, procesów roboczych, funkcji wykonawczych, etapów i zadań, warto przejrzeć architekturę platformy Spark.
Jeśli szukasz kompleksowej listy różnych narzędzi optymalizacyjnych, skorzystaj z przewodnika Optymalizacja Databricks. Sekcje przewodnika optymalizacji znajdują się w tym przewodniku po interfejsie użytkownika platformy Spark.
Korzystanie z tego przewodnika
Aby przejść przez przewodnik, użyj linków osadzonych na każdej stronie, aby przejść do następnego kroku. Przewodnik zawiera następujące kroki w następującej kolejności:
- Użyj linii czasu zadań, aby zidentyfikować główne problemy
- Spójrz na najdłuższy etap
- Poszukaj niesymetryczności lub rozlania
- ustal, czy najdłuższy etap jest ograniczony przez we/wy
- Poszukaj innych przyczyn powolnego działania etapu
Zaczynamy!
Jak otworzyć interfejs użytkownika platformy Spark
Przejdź do strony klastra:
ComputeKliknij Spark UI:
Następny krok
Po otwarciu interfejsu Spark UI, przejrzyj oś czasu zdarzeń, aby dowiedzieć się więcej o swoim potoku lub zapytaniu. Zobacz harmonogram zadań .