Udostępnij przez


Zadanie skryptu języka Python dla zadań

Użyj zadania skryptu języka Python, aby uruchomić plik w języku Python.

Konfigurowanie zadania skryptu języka Python

Przed rozpoczęciem należy przekazać skrypt języka Python do lokalizacji dostępnej dla użytkownika konfigurującego zadanie. Usługa Databricks zaleca używanie plików obszaru roboczego dla skryptów języka Python. Zobacz Czym są pliki obszaru roboczego?.

Note

Interfejs użytkownika zadań wyświetla opcje dynamicznie na podstawie innych skonfigurowanych ustawień.

Databricks odradza przechowywanie kodu lub danych przy użyciu katalogu głównego lub punktów montowania systemu plików DBFS. Zamiast tego można przenieść skrypty języka Python do plików w obszarach roboczych lub woluminach albo użyć identyfikatorów URI do uzyskania dostępu do magazynu obiektów w chmurze.

Aby rozpocząć proces konfiguracji zadania Python script:

  1. Przejdź do karty Zadania w interfejsie użytkownika zadań.
  2. Kliknij pozycję Dodaj zadanie.
  3. Wprowadź nazwę w polu Nazwa zadania .
  4. W menu rozwijanym Typ wybierz pozycję Python script.

Konfigurowanie źródła

W menu rozwijanym Źródło wybierz lokalizację skryptu języka Python przy użyciu jednej z następujących opcji.

Workspace

Użyj obszaru roboczego, aby skonfigurować skrypt języka Python przechowywany za pomocą plików obszaru roboczego.

  1. Kliknij pole Ścieżka. Zostanie wyświetlone okno dialogowe Wybieranie pliku języka Python.
  2. Przejdź do skryptu języka Python, kliknij, aby wyróżnić plik, a następnie kliknij przycisk Potwierdź.

Note

Możesz użyć tej opcji, aby skonfigurować zadanie w skryscie języka Python przechowywanym w folderze Git usługi Databricks. Usługa Databricks zaleca użycie opcji dostawcy Git i zdalnego repozytorium Git do wersjonowania zasobów zaplanowanych w zadaniach.

DBFS/ADLS

Użyj DBFS/ADLS, aby skonfigurować skrypt Pythona przechowywany w woluminie, lokalizacji magazynu obiektów w chmurze lub katalogu głównego DBFS.

Usługa Databricks zaleca przechowywanie skryptów języka Python w woluminach Unity Catalog lub w magazynie obiektów w chmurze.

W polu Ścieżka wprowadź identyfikator URI skryptu języka Python. Na przykład: dbfs:/path/to/script.py lub abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py.

Dostawca usługi Git

Użyj dostawcy Git, aby skonfigurować skrypt Python przechowywany w zdalnym repozytorium Git.

Opcje wyświetlane przez interfejs użytkownika zależą od tego, czy dostawca git został już skonfigurowany w innym miejscu. Tylko jedno zdalne repozytorium Git może być używane dla wszystkich zadań w zadaniu. Zobacz Używanie usługi Git z zadaniami.

Pole Ścieżka pojawi się po skonfigurowaniu odniesienia do git.

Wprowadź ścieżkę względną skryptu języka Python, na przykład etl/bronze/ingest.py.

Important

Po wprowadzeniu ścieżki względnej nie zaczynaj od / ani ./. Jeśli na przykład ścieżka bezwzględna do kodu Python, do którego chcesz uzyskać dostęp, to /etl/bronze/ingest.py, wprowadź etl/bronze/ingest.py w polu Ścieżka.

Konfigurowanie bibliotek obliczeniowych i zależnych

  1. Użyj funkcji Compute , aby wybrać lub skonfigurować klaster, który obsługuje logikę w skryscie.
  2. Jeśli używasz Serverless obliczeń, użyj pola Środowisko i biblioteki , aby wybrać, edytować lub dodać nowe środowisko. Zobacz Konfigurowanie środowiska bezserwerowego.
  3. Dla wszystkich innych konfiguracji obliczeniowych kliknij pozycję + Dodaj w obszarze Biblioteki zależne. Zostanie wyświetlone okno dialogowe Dodawanie biblioteki zależnej .
    • Możesz wybrać istniejącą bibliotekę lub przekazać nową bibliotekę.
    • Można używać tylko bibliotek przechowywanych w lokalizacji obsługiwanej przez konfiguracje obliczeniowe. Zobacz Obsługa biblioteki języka Python.
    • Każde źródło biblioteki ma inną procedurę wybierania lub przesyłania biblioteki. Zobacz Instalowanie bibliotek.

Finalizowanie konfiguracji zadania

  1. (Opcjonalnie) Skonfiguruj parametry jako listę ciągów przekazywanych jako argumenty interfejsu wiersza polecenia do skryptu języka Python. Zobacz Konfigurowanie parametrów zadania.
  2. Kliknij pozycję Zapisz zadanie.