Partilhar via


Visão geral da atividade

As atividades são os blocos de construção que ajudam a criar fluxos de trabalho de dados de ponta a ponta no Microsoft Fabric. Pense neles como as tarefas que movem e transformam seus dados para atender às suas necessidades de negócios. Você pode usar uma atividade de cópia para mover dados do SQL Server para o Armazenamento de Blobs do Azure. Em seguida, você pode adicionar uma atividade de fluxo de dados ou atividade de bloco de anotações para processar e transformar esses dados antes de carregá-los no Azure Synapse Analytics para relatórios.

As atividades são agrupadas em fluxos de trabalho para atingir objetivos específicos. Por exemplo, você pode criar um pipeline que:

  • Obtém dados de log de diferentes fontes
  • Limpa e organiza esses dados
  • Executa análises para encontrar insights

Agrupar suas atividades em um pipeline permite gerenciar todas essas etapas como uma unidade, em vez de lidar com cada atividade separadamente. Você pode implantar e agendar todo o pipeline de uma só vez, para ser executado sempre que precisar.

O Microsoft Fabric oferece três tipos de atividades:

Atividades de movimento de dados

Essas atividades ajudam você a mover dados de um lugar para outro em seu pipeline.

Atividade de movimento Description
Copiar dados Você pode copiar dados de qualquer fonte suportada para qualquer destino suportado. Consulte a visão geral sobre Conectores para saber o que está disponível.
Trabalho de cópia Os trabalhos de cópia são um método simplificado para mover dados rapidamente.

Se você precisar escolher entre diferentes opções de movimentação de dados, consulte o artigo do guia de decisão de movimentação de dados .

Atividades de transformação de dados

Estas atividades ajudam-no a processar e transformar os seus dados. Você pode usá-los individualmente ou encadeá-los juntamente com outras atividades.

Para obter mais informações, veja o artigo Data Transformation Activities (Atividades de Transformação de Dados).

Atividade de transformação de dados Ambiente de computação
Copiar dados Gerenciador de computação do Microsoft Fabric
Fluxo de dados Gen2 Gerenciador de computação do Microsoft Fabric
Excluir dados Gerenciador de computação do Microsoft Fabric
Caderno de tecido Clusters do Apache Spark gerenciados pelo Microsoft Fabric
Atividade do HDInsight Clusters do Apache Spark gerenciados pelo Microsoft Fabric
Definição de trabalho do Spark Clusters do Apache Spark gerenciados pelo Microsoft Fabric
Procedimento armazenado Azure SQL, Azure Synapse Analytics ou SQL Server
Script SQL Azure SQL, Azure Synapse Analytics ou SQL Server

Atividades de fluxo de controlo

Essas atividades ajudam você a controlar como seu pipeline é executado:

Atividade de controlo Description
Append variável Adicione um valor a uma variável de matriz existente.
Atividade do Lote do Azure Executa um script do Azure Batch.
Atividade do Azure Databricks Executa um trabalho do Azure Databricks (Notebook, Jar, Python).
Atividade do Azure Machine Learning Executa um trabalho do Azure Machine Learning.
Desativar atividade Desativa outra atividade.
Fail Faça com que a execução do pipeline falhe com uma mensagem de erro personalizada e um código de erro.
Filter Aplique uma expressão de filtro a uma matriz de entrada.
ForEach A atividade ForEach define um fluxo de controlo de repetição no seu pipeline. Esta atividade é utilizada para iterar uma coleção e executa atividades especificadas em ciclo. A implementação de ciclo desta atividade é semelhante à estrutura de ciclo Foreach nas linguagens de programação.
Atividade de funções Executa uma função do Azure.
Obter metadados A atividade GetMetadata pode ser usada para recuperar metadados de quaisquer dados em um pipeline do Data Factory ou Synapse.
Se condição Se Condição pode ser utilizada com base em ramos numa condição que é avaliada como verdadeira ou falsa. A atividade Se Condição disponibiliza a mesma funcionalidade que as instruções “se” fornecem nas linguagens de programação. Avalia um conjunto de atividades quando a condição é avaliada como true e outro conjunto de atividades quando é avaliada como false.
Invocar pipeline A atividade Executar pipeline permite que um pipeline do Data Factory ou Synapse invoque outro pipeline.
Atividade KQL Executa um script KQL em uma instância de Kusto.
Atividade de pesquisa A atividade de Pesquisa pode ser utilizada para ler ou procurar registos/nomes de tabelas/valores em qualquer origem externa. Este resultado pode ser ainda referenciado por atividades subsequentes.
Definir variável Defina o valor de uma variável existente.
Atividade do switch Implementa uma expressão de switch que permite várias atividades subsequentes para cada resultado potencial da expressão.
Atividade das equipas Publica uma mensagem em um canal do Teams ou bate-papo em grupo.
Até à atividade Implementa o ciclo Do-Until que é semelhante à estrutura de ciclo Do-Until nas linguagens de programação. Executa um conjunto de atividades num ciclo até que a condição associada às atividades seja avaliada como verdadeira. Você pode especificar um valor de tempo limite para a atividade até.
Atividade de espera Quando você usa uma atividade de espera em um pipeline, o pipeline aguarda o tempo especificado antes de continuar com a execução das atividades subsequentes.
Atividade na Web A Atividade da Web pode ser usada para chamar um ponto de extremidade REST personalizado a partir de um pipeline.
Atividade do Webhook Usando a atividade webhook, chame um ponto de extremidade e passe uma URL de retorno de chamada. A execução do pipeline aguarda que o retorno de chamada seja invocado antes de prosseguir para a próxima atividade.

Adicionando atividades a um pipeline com a interface do usuário do Microsoft Fabric

Veja como adicionar e configurar atividades em seu pipeline:

  1. Crie um novo pipeline em seu espaço de trabalho.
  2. Vá para a guia Atividades e navegue pelas atividades disponíveis. Role para a direita para ver todas as opções e selecione uma atividade para adicioná-la ao editor de pipeline.
  3. Ao adicionar uma atividade e selecioná-la na tela, você verá suas Configurações gerais no painel de propriedades abaixo.
  4. Cada atividade tem outras opções de configuração em outras guias no painel de propriedades.

Captura de tela mostrando o editor de pipeline com a guia Atividades, barra de ferramentas, uma atividade de cópia e a guia Geral de suas propriedades, todas realçadas.

Configurações gerais

Ao adicionar uma nova atividade a um pipeline e selecioná-la, você verá suas propriedades na parte inferior da tela. Estes incluem Geral, Definições e, por vezes, outros separadores.

Captura de ecrã a mostrar o separador Definições gerais de uma atividade.

Cada atividade inclui campos Nome e Descrição nas configurações gerais. Algumas atividades também têm estas opções:

Setting Description
Timeout Quanto tempo uma atividade pode ser executada antes do tempo limite. O padrão é 12 horas e o máximo é sete dias. Use o formato D.HH:MM:SS.
Retry Quantas vezes tentar novamente se a atividade falhar.
(Propriedades avançadas) Intervalo de repetição (seg) Quantos segundos esperar entre as tentativas de repetição.
(Propriedades avançadas) Saída segura Quando selecionada, a saída da atividade não aparecerá nos registos.
(Propriedades avançadas) Entrada segura Quando selecionada, a entrada de atividade não aparecerá nos logs.

Note

Por padrão, você pode ter até 120 atividades por pipeline. Isso inclui atividades internas para contêineres.