Obter dados do Armazenamento do Azure

Neste artigo, você aprenderá a obter dados do Armazenamento do Azure (contêiner do ADLS Gen2, contêiner de blobs ou blobs individuais). Você pode inserir dados em sua tabela continuamente ou de uma só vez. Depois de ingeridos, os dados ficam disponíveis para consulta.

Ingestão contínua (versão prévia): a ingestão contínua envolve a configuração de um pipeline de ingestão que permite que uma casa de eventos ouça eventos do Armazenamento do Azure. O pipeline notifica a central de eventos para extrair informações quando eventos subscritos ocorrerem. Os eventos são BlobCreated e BlobRenamed.

Importante

Esse recurso está na versão prévia.
Ingestão única: use esse método para recuperar dados do Armazenamento do Azure como uma operação única.
Observação
- Um fluxo de ingestão contínua pode afetar sua cobrança. Para obter mais informações, consulte consumo de Eventhouse e de Banco de Dados KQL.

Aviso

Não há suporte para a ingestão de uma conta de Armazenamento do Azure (contínua e para uma única vez) usando um link privado.

Pré-requisitos

Um workspace com uma capacidade habilitada para Microsoft Fabric.
Um banco de dados KQL com permissões de edição.
Uma conta de armazenamento do Azure.

Pré-requisitos para ingestão contínua

Uma identidade de workspace do Fabric. Não há suporte para meu workspace. Se necessário, crie um novo workspace.

No ambiente do Azure:

Registre o provedor de recursos da Grade de Eventos com sua assinatura do Azure.
Atribua permissões de função Storage Blob Data Reader à identidade do workspace.
Atribua permissões ao usuário que configura a ingestão contínua ou a um grupo do AD com o usuário que está configurando a ingestão contínua:
- Colaborador da Conta de Armazenamento.
- Permissão de Colaborador do EventGrid.
Crie um contêiner de blob para armazenar os arquivos de dados.
- Carregue um arquivo de dados. A estrutura do arquivo de dados é usada para definir o esquema de tabela. Para obter mais informações, consulte Formatos de dados compatíveis com Real-Time Intelligence.
  Observação
  
  Você deve carregar um arquivo de dados:
  - Antes da configuração para definir o esquema de tabela durante a instalação.
  - Depois da configuração para disparar a ingestão contínua, visualizar dados e verificar a conexão.

Adicionar a atribuição de função de identidade do workspace à conta de armazenamento

Nas configurações do espaço de trabalho no Fabric, copie o ID de identidade do espaço de trabalho.
No portal do Azure, navegue até sua conta de Armazenamento do Azure e selecione Controle de Acesso (IAM)>Adicionar>Adicionar atribuição de função.
Selecione Leitor de Dados do Blob de Armazenamento.
Na caixa de diálogo Adicionar atribuição de função , selecione + Selecionar membros.
Cole o ID da identidade do workspace, selecione o aplicativo e depois Selecionar>Revisar + atribuir.

Criar um contêiner com o arquivo de dados

Na conta de armazenamento, selecione Contêineres.
Selecione + Contêiner, insira um nome para o contêiner e selecione Salvar.
Insira o contêiner, selecione carregar e carregue o arquivo de dados preparado anteriormente.

Para obter mais informações, consulte formatos com suporte e compactações com suporte.
No menu de contexto , [...], selecione propriedades de contêiner e copie a URL para entrada durante a configuração.

Fonte

Defina a origem para obter dados.

No workspace, abra o EventHouse e selecione o banco de dados.
Na faixa de opções do banco de dados KQL, selecione Obter Dados.
Selecione a fonte de dados na lista disponível. Neste exemplo, você está ingerindo dados do armazenamento do Azure.

Selecione uma tabela de destino. Se você quiser ingerir dados em uma nova tabela, selecione + Nova tabela e insira um nome de tabela.

Observação

Os nomes de tabelas podem ter até 1024 caracteres, incluindo espaços, caracteres alfanuméricos, hifens e sublinhados. Não há suporte para caracteres especiais.
Na Configuração da conexão do Armazenamento de Blobs do Azure, verifique se a ingestão contínua está ativada. Ele está ativado por padrão.

Configure a conexão criando uma nova conexão ou usando uma conexão existente.

Para criar uma nova conexão:

Selecione Conectar a uma conta de armazenamento.

Use as descrições a seguir para ajudar a preencher os campos.

Configuração	Descrição do campo
Subscrição	A assinatura da conta de armazenamento.
Conta de armazenamento de blobs	Nome da conta de armazenamento.
Contêiner	O contêiner de armazenamento que contém o arquivo que você deseja ingerir.

Observação

Não há suporte para o uso de um link privado .

No campo Conexão, abra a lista suspensa e selecione + Nova conexão, então Salvar> e Fechar. As configurações de conexão são pré-preenchidas.

Observação

A criação de uma nova conexão resulta em um novo Eventstream. O nome é definido como <storate_account_name>_eventstream. Certifique-se de não remover o fluxo de eventos de ingestão contínua do espaço de trabalho.

Para usar uma conexão existente:

Selecione Selecionar uma conta de armazenamento existente.

Use as descrições a seguir para ajudar a preencher os campos.

Configuração	Descrição do campo
RTAStorageAccount	Um fluxo de eventos conectado à sua conta de armazenamento do Fabric.
Contêiner	O contêiner de armazenamento que contém o arquivo que você deseja ingerir.
Conexão	Isso é preenchido automaticamente com a cadeia de conexão

No campo Conexão , abra a lista suspensa e selecione a cadeia de conexão existente na lista. Em seguida, selecione Salvar>Fechar.

Opcionalmente, expanda filtros de arquivo e especifique os seguintes filtros:

Configuração	Descrição do campo
Caminho da pasta	Filtra dados para ingerir arquivos com um caminho de pasta específico.
Extensão de arquivo	Filtra dados para ingerir arquivos com somente uma extensão de arquivo específica.

Na seção Configurações do Eventstream, você pode selecionar os eventos a serem monitorados em Configurações Avançadas>Tipo(s) de Evento. Por padrão, o Blob criado é selecionado. Você também pode selecionar Bloco renomeado.
Selecione Avançar para visualizar os dados.

Selecione uma tabela de destino. Se você quiser ingerir dados em uma nova tabela, selecione + Nova tabela e insira um nome de tabela.

Observação

Os nomes de tabelas podem ter até 1024 caracteres, incluindo espaços, caracteres alfanuméricos, hifens e sublinhados. Não há suporte para caracteres especiais.
Na configuração da conexão com o Armazenamento de Blobs do Azure, verifique se a ingestão contínua está desativada. Ele está ativado por padrão.

Para criar uma nova conexão, crie uma nova conexão ou use uma conexão existente.

Para criar uma nova conexão:

Selecione Conectar a uma conta de armazenamento.
Use as descrições a seguir para ajudar a preencher os campos.

Configuração	Descrição do campo
Subscrição	O nome da assinatura em que a conta de armazenamento está localizada.
Conta de armazenamento de blobs	O nome que identifica sua conta de armazenamento. Se a conta for renomeada no Azure, você precisará atualizar a conexão selecionando o novo nome.
Contêiner	O contêiner de armazenamento que contém o arquivo que você deseja ingerir.

Para conectar uma conta existente:

Para criar uma conexão usando uma URL SAS, selecione Usar uma URL SAS para ingerir de uma conta de armazenamento.

Cole a cadeia de conexão de armazenamento no campo Inserir URL sas e selecione +.

A cadeia de caracteres consiste em um URI de blob com um token SAS ou chave de conta. A tabela a seguir lista os métodos de autenticação com suporte e as permissões necessárias para ingerir dados do Armazenamento do Azure.

Método de autenticação	Blob individual	Contêiner de blob	Azure Data Lake Storage Gen2
Token de Acesso Compartilhado (SAS)	Ler e Gravar	Leitura e listagem	Leitura e listagem
[Chave de acesso da conta de armazenamento](/azure/data-explorer/kusto/api/connection-strings/storage-connection-strings#storage-account-access-key?context=/fabric/context/context#storage-account-access-key)

Observação

Você pode adicionar até 10 blobs individuais ou ingerir até 5.000 blobs de um único contêiner. Você não pode ingerir ambos ao mesmo tempo.
Cada blob pode ter no máximo 1 GB descompactado.

Opcionalmente, expanda filtros de arquivo e especifique os seguintes filtros:

Configuração	Descrição do campo
Caminho da pasta	Filtra dados para ingerir arquivos com um caminho de pasta específico.
Extensão de arquivo	Filtra dados para ingerir arquivos com somente uma extensão de arquivo específica.

Selecione Avançar para visualizar os dados.

Inspecionar

A guia Inspecionar será aberta com uma visualização dos dados.

Para concluir o processo de ingestão, selecione Concluir.

Observação

Para evocar a ingestão contínua e visualizar dados, verifique se você carregou um novo blob de armazenamento após a configuração.

Opcionalmente:

Use a lista suspensa do arquivo de definição de esquema para alterar o arquivo do qual o esquema é inferido.
Use a lista suspensa de tipo de arquivo para explorar opções avançadas com base no tipo de dados.
Use o menu suspenso "Table_mapping" para definir um novo mapeamento.
Selecione </> para abrir o visualizador de comandos para exibir e copiar os comandos automáticos gerados de suas entradas. Você também pode abrir os comandos em um conjunto de consultas
Selecione o ícone de lápis para Editar colunas.

Editar colunas

Observação

Para formatos de tabela (CSV, TSV,VP), não é possível mapear uma coluna duas vezes. Para mapear para uma coluna existente, primeiro exclua a nova coluna.
Não é possível alterar um tipo de coluna existente. Se você tentar mapear para uma coluna com um formato diferente, poderá acabar com colunas vazias.

As alterações que você pode fazer em uma tabela dependem dos seguintes parâmetros:

A tabela é do tipo novo ou existente
Tipo de mapeamento é novo ou existente

Tipo de tabela	Tipo de mapeamento	Ajustes disponíveis
Nova tabela	Novo mapeamento	Renomear coluna, alterar tipo de dados, alterar fonte de dados, transformação de mapeamento, adicionar coluna, excluir coluna
Tabela existente	Novo mapeamento	Adicionar coluna (na qual você pode alterar o tipo de dados, renomear e atualizar)
Tabela existente	Mapeamento existente	nenhum

Mapeamento de transformações

Alguns mapeamentos de formato de dados (Parquet, JSON e Avro) dão suporte a transformações simples de tempo de ingestão. Para aplicar transformações de mapeamento, crie ou atualize uma coluna na janela Editar colunas.

As transformações de mapeamento podem ser executadas em uma coluna do tipo string ou datetime, com a origem possuindo o tipo de dados int ou long. Para obter mais informações, confira a lista completa de transformações de mapeamento com suporte.

Opções avançadas com base no tipo de dados

Tabela (CSV, TSV, PSV):

Se você estiver ingerindo formatos tabulares em uma tabela existente, poderá selecionar Avançado>Manter esquema de tabela. Os dados tabulares não incluem necessariamente os nomes de coluna usados para mapear dados de origem para as colunas existentes. Quando essa opção é verificada, o mapeamento é feito por ordem e o esquema da tabela permanece o mesmo. Se essa opção estiver desmarcada, novas colunas serão criadas para dados de entrada, independentemente da estrutura de dados.
Os dados tabulares não incluem necessariamente os nomes de coluna usados para mapear dados de origem para as colunas existentes. Para usar a primeira linha como nomes de coluna, selecione A primeira linha é o cabeçalho da coluna.

Tabela (CSV, TSV, PSV):

Se você estiver ingerindo formatos tabulares em uma tabela existente, poderá selecionar Table_mapping>Usar esquema existente. Os dados tabulares não incluem necessariamente os nomes de coluna usados para mapear dados de origem para as colunas existentes. Quando essa opção é verificada, o mapeamento é feito por ordem e o esquema da tabela permanece o mesmo. Se essa opção estiver desmarcada, novas colunas serão criadas para dados de entrada, independentemente da estrutura de dados.
Para usar a primeira linha como nomes de coluna, selecione Primeira linha como cabeçalho.

JSON:

Para determinar a divisão em colunas dos dados JSON, selecione níveis aninhados, de 1 a 100.

Resumo

Na janela Resumo , todas as etapas são marcadas com marcas de verificação verdes quando a ingestão de dados é concluída com êxito. Você pode selecionar um cartão para explorar os dados, excluir os dados ingeridos ou criar um painel com as principais métricas.

Ingestão contínua
Ingestão única

Ao fechar a janela, você pode ver a conexão na guia Explorer, em fluxos de dados. A partir daqui, você pode filtrar os fluxos de dados e excluir um fluxo de dados.

Para gerenciar seu banco de dados, consulte Gerenciamento de dados
Para criar, armazenar e exportar consultas, consulte Consultar dados em um conjunto de consultas KQL

Comentários

Esta página foi útil?

Last updated on 2025-11-25

Compartilhar via

Obter dados do Armazenamento do Azure

Pré-requisitos

Pré-requisitos para ingestão contínua

Adicionar a atribuição de função de identidade do workspace à conta de armazenamento

Criar um contêiner com o arquivo de dados

Fonte

Configurar

Inspecionar

Editar colunas

Mapeamento de transformações

Opções avançadas com base no tipo de dados

Resumo

Conteúdo relacionado

Comentários

Recursos adicionais