Partilhar via


Comando sync

Note

Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Pré-Visualização Pública.

O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer disposições de Dados de Uso.

O sync grupo de comandos dentro da CLI Databricks permite a sincronização unidirecional do código local e das alterações de ficheiros num diretório na sua máquina de desenvolvimento local para uma pasta no seu espaço de trabalho remoto Azure Databricks.

Note

  • sync não é possível sincronizar alterações de arquivo de uma pasta em um espaço de trabalho remoto do Azure Databricks de volta para um diretório em sua máquina de desenvolvimento local.
  • sync pode sincronizar alterações de ficheiros de uma máquina de desenvolvimento local apenas para ficheiros de utilizador (/Users) no seu espaço de trabalho Azure Databricks. Não pode sincronizar com ficheiros DBFS (dbfs:/). Para sincronizar alterações de ficheiros de uma máquina local de desenvolvimento para o DBFS (dbfs:/) no seu espaço de trabalho Azure Databricks, use a ferramenta de sincronização dbx .

Databricks sincronização

Sincronize um diretório local com um diretório de espaço de trabalho.

databricks sync [flags] SRC DST

Arguments

SRC

    O caminho do diretório de origem

DST

    O caminho do diretório de destino

Opções

--dry-run

    Simule a execução da sincronização sem fazer alterações reais

--exclude strings

    Padrões a serem excluídos da sincronização (podem ser especificados várias vezes)

--exclude-from string

    Arquivo contendo padrões a serem excluídos da sincronização (um padrão por linha)

--full

    Executar sincronização completa (o padrão é incremental)

--include strings

    Padrões a serem incluídos em sincronia (podem ser especificados várias vezes)

--include-from string

    Arquivo contendo padrões a serem incluídos para sincronização (um padrão por linha)

--interval duration

    Intervalo de sondagem do sistema de arquivos (para --watch) (padrão 1s)

--watch

    Observe as alterações no sistema de arquivos local

Bandeiras globais

Examples

As seções a seguir mostram como usar o sync comando.

Sincronizar incrementalmente alterações de arquivos locais em um diretório remoto

Para executar uma sincronização única, incremental e unidirecional de alterações de arquivo dentro de um diretório local para uma pasta em um espaço de trabalho remoto do Azure Databricks, execute o sync comando, da seguinte maneira:

databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para fazer uma sincronização incremental, unidirecional e única de todas as alterações de arquivo na pasta nomeada my-local-folder no diretório de trabalho atual local, para a pasta my-workspace-folder no espaço de trabalho remoto, execute o seguinte comando:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder

Neste exemplo, apenas as alterações de arquivo desde a sync última execução do comando são sincronizadas com ./Users/someone@example.com/my-workspace-folder Por padrão, a URL do espaço de trabalho no perfil do DEFAULT chamador é usada para determinar o espaço de trabalho remoto com o qual sincronizar.

Sincronize apenas ficheiros específicos

Para incluir ou excluir ficheiros específicos para sincronização com base em padrões especificados, use as opções --include, --include-from, --exclude ou --exclude-from.

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore

Note

Se pretender sincronizar ficheiros num conjunto, utilize o mapeamento de sync configuração em vez disso. Veja sync.

O exemplo a seguir exclui determinados padrões de arquivo da sincronização:

databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder

Sincronize totalmente as alterações de arquivos locais em um diretório remoto

Para executar uma sincronização única, completa e unidirecional de alterações de arquivo dentro de um diretório local para uma pasta em um espaço de trabalho remoto do Azure Databricks, independentemente de quando o último sync comando foi executado, use a --full opção, por exemplo:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full

Sincronizar continuamente alterações de arquivos locais em um diretório remoto

Para ativar a sincronização contínua e unidirecional de alterações de arquivo em um diretório local para uma pasta em um workspace remoto do Azure Databricks, use a opção --watch, por exemplo:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch

A sincronização unidirecional continua até que o comando seja interrompido a partir do terminal, normalmente pressionando Ctrl + c ou Ctrl + z.

A sondagem para possíveis eventos de sincronização acontece uma vez por segundo por padrão. Para alterar esse intervalo, use a --interval opção juntamente com o número de segundos para sondar seguido pelo caractere s, por exemplo, por cinco segundos:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s

Alterar o formato de saída do progresso da sincronização

As informações de progresso da sincronização são enviadas para o terminal em formato de texto por padrão. Para especificar o formato de saída do progresso da sincronização, use a opção --output, especificando ou text (o padrão, se --output não for especificado de outra forma) ou json; por exemplo:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json

Visualizar operações de ficheiro para uma sincronização

Para visualizar uma sincronização sem realmente executar as operações de sincronização de arquivos, use a --dry-run opção, por exemplo:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete

Bandeiras globais

--debug

  Se o log de depuração deve ser habilitado.

-h ou --help

    Exiba a ajuda para a CLI do Databricks ou para o grupo de comandos relacionado ou para o comando relacionado.

--log-file string

    Uma cadeia de caracteres que representa o ficheiro onde os registos de saída são gravados. Se esse sinalizador não for especificado, o padrão é gravar logs de saída no stderr.

--log-format Formato

    O tipo de formato de log, text ou json. O valor predefinido é text.

--log-level string

    Uma cadeia de caracteres que representa o nível de formato de log. Se não for especificado, o nível de formato de log será desativado.

-o, --output tipo

    O tipo de saída do comando, text ou json. O valor predefinido é text.

-p, --profile string

    O nome do perfil no arquivo ~/.databrickscfg a ser usado para executar o comando. Se esse sinalizador não for especificado, se ele existir, o perfil nomeado DEFAULT será usado.

--progress-format Formato

    O formato para exibir logs de progresso: default, append, inplace, ou json

-t, --target string

    Se aplicável, o destino do pacote a ser usado