Freigeben über


sync-Befehl

Note

Diese Informationen gelten für Databricks CLI-Versionen 0.205 und höher. Die Databricks CLI befindet sich in der öffentlichen Vorschau.

Die Verwendung von Databricks CLI unterliegt der Datenbricks-Lizenz - und Databricks-Datenschutzerklärung, einschließlich der Bestimmungen zu Nutzungsdaten.

Die sync Befehlsgruppe in der Databricks CLI ermöglicht die unidirektionale Synchronisierung von lokalem Code und Dateiänderungen in einem Verzeichnis auf Ihrem lokalen Entwicklungscomputer in einem Ordner in Ihrem Remote-Azure Databricks-Arbeitsbereich.

Note

  • sync Dateiänderungen aus einem Ordner in einem Azure Databricks-Remotearbeitsbereich können nicht mit einem Verzeichnis auf Ihrem lokalen Entwicklungscomputer synchronisiert werden.
  • sync Kann Dateiänderungen von einem lokalen Entwicklungscomputer nur mit Arbeitsbereichsbenutzerdateien (/Users) in Ihrem Azure Databricks-Arbeitsbereich synchronisieren. Mit DBFS-Dateien kann nicht synchronisiert werden. Um Dateiänderungen von einem lokalen Entwicklungscomputer mit DBFS (dbfs:/) in Ihrem Azure Databricks-Arbeitsbereich zu synchronisieren, verwenden Sie das DbX-Synchronisierungsprogramm .

Databricks-Synchronisierung

Synchronisiert ein lokales Verzeichnis mit einem Arbeitsbereichsverzeichnis

databricks sync [flags] SRC DST

Arguments

SRC

    Der Quellverzeichnispfad

DST

    Der Zielverzeichnispfad

Options

--dry-run

    Simulieren der Synchronisierungsausführung, ohne tatsächliche Änderungen vorzunehmen

--exclude strings

    Muster, die aus der Synchronisierung ausgeschlossen werden sollen (können mehrmals angegeben werden)

--exclude-from string

    Datei mit Mustern, die von der Synchronisierung ausgeschlossen werden sollen (ein Muster pro Zeile)

--full

    Vollständige Synchronisierung durchführen (Standard ist inkrementell)

--include strings

    Muster, die in die Synchronisierung aufgenommen werden sollen (können mehrmals angegeben werden)

--include-from string

    Datei mit Mustern zum Einschließen zur Synchronisierung (ein Muster pro Zeile)

--interval duration

    Abfrageintervall des Dateisystems (für --watch) (Default 1s)

--watch

    Überwachen des lokalen Dateisystems für Änderungen

Globale Kennzeichnungen

Examples

In den folgenden Abschnitten wird die Verwendung des sync Befehls veranschaulicht.

Inkrementelle Synchronisierung lokaler Dateiänderungen mit einem Remoteverzeichnis

Um eine einzelne, inkrementelle, unidirektionale Synchronisierung von Dateiänderungen innerhalb eines lokalen Verzeichnisses mit einem Ordner in einem Azure Databricks-Remotearbeitsbereich durchzuführen, führen Sie den sync Befehl wie folgt aus:

databricks sync <local-directory-path> <remote-directory-path>

Führen Sie beispielsweise den folgenden Befehl aus, um eine einmalige, unidirektionale inkrementelle Synchronisierung aller Dateiänderungen im Ordner my-local-folder des aktuellen lokalen Arbeitsverzeichnisses mit dem Ordner my-workspace-folder im Remote-Arbeitsbereich auszuführen:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder

In diesem Beispiel werden nur Dateiänderungen seit der letzten Ausführung des sync-Befehls mit /Users/someone@example.com/my-workspace-foldersynchronisiert. Standardmäßig wird die Arbeitsbereichs-URL innerhalb des Profils des Aufrufers DEFAULT verwendet, um den zu synchronisierenden Remotearbeitsbereich zu bestimmen.

Nur bestimmte Dateien synchronisieren

Wenn Sie bestimmte Dateien einschließen oder ausschließen wollen, die basierend auf spezifizierten Mustern synchronisiert werden sollen, verwenden Sie die Optionen --include, --include-from, --exclude oder --exclude-from.

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore

Note

Wenn Sie Dateien in einem Bündel synchronisieren möchten, verwenden Sie stattdessen die sync Konfigurationszuordnung. Weitere Informationen finden Sie unter sync.

Im folgenden Beispiel werden bestimmte Dateimuster von der Synchronisierung ausgeschlossen:

databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder

Vollständige Synchronisierung lokaler Dateiänderungen mit einem Remoteverzeichnis

Um eine einzelne, vollständige, unidirektionale Synchronisierung von Dateiänderungen innerhalb eines lokalen Verzeichnisses mit einem Ordner in einem Azure Databricks-Remotearbeitsbereich durchzuführen, verwenden Sie unabhängig davon, wann der letzte sync Befehl ausgeführt wurde, die --full Option, z. B.:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full

Fortlaufende Synchronisierung lokaler Dateiänderungen mit einem Remoteverzeichnis

Um die fortlaufende, unidirektionale Synchronisierung von Dateiänderungen in einem lokalen Verzeichnis mit einem Ordner in einem Azure Databricks-Arbeitsbereich zu aktivieren, verwenden Sie die Option --watch, zum Beispiel:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch

Die unidirektionale Synchronisierung wird fortgesetzt, bis der Befehl über das Terminal beendet wird, was in der Regel durch Drücken von Ctrl + c oder Ctrl + z geschieht.

Das Abfragen möglicher Synchronisierungsereignisse werden standardmäßig einmal pro Sekunde ausgeführt. Um dieses Intervall zu ändern, verwenden Sie die Option --interval zusammen mit der Anzahl der Sekunden, nach der abgerufen werden sollen, gefolgt vom Zeichen s. Geben Sie z. B. Folgendes an, um das Intervall in fünf Sekunden zu ändern:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s

Ändern des Ausgabeformats für den Synchronisierungsstatus

Informationen zum Synchronisierungsstatus werden standardmäßig im Textformat an das Terminal ausgegeben. Um das Ausgabeformat für den Synchronisierungsstatus anzugeben, verwenden Sie die Option --output, und geben Sie entweder text (Standardeinstellung, wenn --output nichts anderes angegeben wird) oder json an, z. B.:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json

Anzeigen einer Vorschau von Dateivorgängen für eine Synchronisierung

Wenn Sie eine Vorschau einer Synchronisierung anzeigen möchten, ohne die Dateisynchronisierungsvorgänge tatsächlich auszuführen, verwenden Sie die --dry-run Option, z. B.:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete

Globale Kennzeichnungen

--debug

  Gibt an, ob die Debugprotokollierung aktiviert werden soll.

-h oder --help

    Hilfe für die Databricks CLI oder die zugehörige Befehlsgruppe oder den zugehörigen Befehl anzeigen.

--log-file Schnur

    Eine Zeichenfolge, die die Datei darstellt, in die Ausgabeprotokolle geschrieben werden sollen. Wenn dieses Flag nicht angegeben ist, werden Ausgabeprotokolle standardmäßig in stderr geschrieben.

--log-format Format

    Der Protokollformattyp text oder json. Der Standardwert ist text.

--log-level Schnur

    Eine Zeichenfolge, die die Protokollformatebene darstellt. Wenn nicht angegeben, ist die Protokollformatebene deaktiviert.

-o, --output Typ

    Der Befehlsausgabetyp text oder json. Der Standardwert ist text.

-p, --profile Schnur

    Der Name des Profils in der ~/.databrickscfg Datei, das zum Ausführen des Befehls verwendet werden soll. Wenn dieses Flag nicht angegeben ist, aber existiert, wird das Profil DEFAULT verwendet.

--progress-format Format

    Das Format zum Anzeigen von Statusprotokollen: default, , append, inplaceoder json

-t, --target Schnur

    Falls zutreffend, das zu verwendende Bündelziel