Compartilhar via


Grupo de comandos fs

Note

Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.

O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer provisionamentos de Dados de Uso.

O fs grupo de comandos dentro da CLI do Databricks permite que você execute operações do sistema de arquivos em volumes no Catálogo do Unity e no DBFS (Sistema de Arquivos do Databricks).

Os comandos fs exigem que os caminhos de volume comecem com dbfs:/Volumes e exigem que os caminhos de diretório e arquivo no DBFS comecem com dbfs:/.

Para executar operações em arquivos de workspace no /Workspace diretório, use databricks workspace comandos. Consulte workspace o grupo de comandos.

Important

Não há suporte para o uso da CLI do Databricks ou das APIs REST com contêineres de armazenamento habilitados para firewall. O Databricks recomenda que você use o Databricks Connect ou az storage.

databricks fs cat

Exibir o conteúdo de um arquivo. Especifique o caminho para o arquivo no DBFS.

databricks fs cat FILE_PATH [flags]

Arguments

FILE_PATH

    O arquivo de saída

Opções

Sinalizadores globais

Examples

Os exemplos a seguir geram o conteúdo do arquivo nomeado babynames.csv encontrado na raiz do volume especificado ou em um tmp diretório dentro da raiz DBFS:

databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

Os exemplos a seguir retornam erros, pois tentam gerar o conteúdo de um diretório em vez de um arquivo:

databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

databricks fs cp

Copie um diretório ou um arquivo. Especifique os caminhos para o diretório ou arquivo de origem para copiar e seu destino. Você pode copiar diretórios e arquivos entre o sistema de arquivos local e o DBFS e copiar diretórios e arquivos entre caminhos DBFS.

O comando cp assume file:/, se file:/ for omitido.

databricks fs cp SOURCE_PATH TARGET_PATH [flags]

Arguments

SOURCE_PATH

    O diretório de origem ou o caminho do arquivo

TARGET_PATH

    O diretório de destino ou o caminho do arquivo

Opções

--overwrite

    Substituir arquivos existentes

-r, --recursive

    Copiar arquivos recursivamente em um diretório

Sinalizadores globais

Examples

Os exemplos a seguir copiam um diretório nomeado squirrel-data e seu conteúdo, de um caminho de sistema de arquivos local para um squirrels diretório dentro da raiz do volume especificado ou da raiz DBFS.

databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

O exemplo a seguir copia um arquivo nomeado squirrels.csv de um caminho de sistema de arquivos local para um diretório nomeado squirrel-data dentro da raiz do volume especificado ou da raiz DBFS. Se o arquivo já existir no destino, ele será substituído.

databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

databricks fs ls

Liste o conteúdo de um diretório especificado em um volume ou em DBFS.

databricks fs ls DIR_PATH [flags]

Arguments

DIR_PATH

    O caminho do diretório

Opções

--absolute

    Exibir caminhos absolutos.

--long, -l

    Exibe informações completas, incluindo tamanho, tipo de arquivo e tempo de modificação desde Época em milissegundos.

Sinalizadores globais

Examples

Os exemplos a seguir listam os nomes dos objetos encontrados na raiz do volume especificado ou na raiz do DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

Os exemplos a seguir listam as informações completas (longas) dos objetos encontrados na raiz do volume especificado ou em um tmp diretório dentro da raiz DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

Os exemplos a seguir listam as informações completas dos objetos e os caminhos completos dos objetos, encontrados na raiz do volume especificado ou em um tmp diretório dentro da raiz DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

databricks fs mkdir

Cria um diretório. Especifique o caminho para o diretório a ser criado em um volume ou no DBFS. Se o diretório já existir, nada acontecerá.

databricks fs mkdir DIR_PATH [flags]

Arguments

DIR_PATH

    O caminho do diretório a ser criado

Opções

Sinalizadores globais

Examples

Os exemplos a seguir criam um diretório nomeado squirrel-data na raiz do volume especificado ou em um diretório nomeado tmp dentro da raiz DBFS:

databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

databricks fs rm

Remove um diretório. Especifique o caminho para o diretório existente no DBFS.

Se o diretório existir, mas não estiver vazio, um erro será retornado. Se o diretório não existir, nada acontecerá.

databricks fs rm PATH [flags]

Arguments

PATH

    O caminho para o diretório existente no DBFS

Opções

-r, --recursive

    Remover todo o conteúdo

Sinalizadores globais

Examples

Os exemplos a seguir removem um diretório nomeado squirrel-data da raiz do volume especificado ou de um diretório tmp na raiz do DBFS:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

Os exemplos a seguir removem um diretório não vazio nomeado squirrel-data da raiz do volume especificado ou de um diretório tmp na raiz do DBFS.

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r

Sinalizadores globais

--debug

  Indica se deve habilitar o registro em log de depuração.

-h ou --help

    Exiba ajuda para a CLI do Databricks ou o grupo de comandos relacionado ou o comando relacionado.

--log-file corda

    Uma cadeia de caracteres que representa o arquivo onde serão gravados os logs de saída. Se esse sinalizador não for especificado, o padrão será gravar logs de saída no stderr.

--log-format formato

    O tipo de formato de log, text ou json. O valor padrão é text.

--log-level corda

    Uma cadeia de caracteres que representa o nível de formato de log. Se não for especificado, o nível de formato de log será desabilitado.

-o, --output tipo

    O tipo de saída do comando, text ou json. O valor padrão é text.

-p, --profile corda

    O nome do perfil no arquivo ~/.databrickscfg, que deverá ser usado para executar o comando. Se esse sinalizador não for especificado, se existir, o perfil nomeado DEFAULT será usado.

--progress-format formato

    O formato para exibir logs de progresso: default, append, inplace ou json

-t, --target corda

    Se aplicável, o destino do pacote a ser usado