Partilhar via


Extrair dados SAP para o Microsoft Fabric

Neste artigo, você obtém uma compreensão abrangente das diferentes fontes de dados e ferramentas disponíveis para extração de dados SAP e como selecionar a opção mais apropriada com base em suas metas analíticas. O conteúdo abrange a estrutura e a finalidade de cada camada de dados dentro dos sistemas SAP. Ele também destaca os recursos de integração com o Microsoft Fabric e as considerações sobre confiabilidade, desempenho e alinhamento de negócios.

O Microsoft Fabric é uma plataforma de dados totalmente integrada baseada em SaaS que unifica engenharia de dados, análise em tempo real, ciência de dados, business intelligence e governança em uma única experiência. Desenvolvido no OneLake, o Fabric centraliza o armazenamento de dados e permite a colaboração perfeita entre funções, de engenheiros de dados a usuários corporativos. Em seu núcleo está o OneLake, um data lake unificado que centraliza o armazenamento e permite o acesso contínuo aos dados entre serviços. O Fabric também integra recursos de IA por meio do Copilot e do Azure AI Studio, capacitando os usuários a obter insights de forma mais rápida e intuitiva. Projetado para simplicidade, escalabilidade e colaboração, o Microsoft Fabric ajuda as organizações a simplificar seus fluxos de trabalho de análise, reduzir a complexidade e acelerar sua jornada de transformação de IA

As empresas estão adotando cada vez mais o Microsoft Fabric como a base de seu cenário de dados para unificar aplicativos de negócios, telemetria IoT e cargas de trabalho de IA. Ao consolidar todas as cargas de trabalho de análise em um único ambiente, o Microsoft Fabric acelera a entrega de insights e elimina silos de dados. Os sistemas SAP são uma das fontes de dados mais críticas, pois contêm dados que suportam as principais operações de negócios e também podem ser integrados à plataforma unificada. Essa integração enriquece os dados corporativos e permite uma visão mais holística do desempenho dos negócios. Você pode criar painéis poderosos que exploram tendências e destacam problemas, refletindo processos de negócios de ponta a ponta usando dados de todos os sistemas e departamentos, independentemente de sua origem. Isso é possível ao ter todos os dados relevantes unificados em uma única plataforma.

Importante

Antes de iniciar qualquer extração de dados dos sistemas SAP, verifique sempre os direitos de licenciamento SAP da sua organização. Certos métodos de extração podem exigir outras licenças ou direitos de uso específicos.

Fontes de dados no sistema SAP

A SAP oferece várias camadas de acesso a dados, cada uma atendendo a diferentes necessidades analíticas e de relatórios. Esta seção apresenta os principais tipos de fontes de dados disponíveis em um cenário SAP, explicando o que são e como funcionam.

Tabelas e vistas

As tabelas SAP são a camada fundamental de armazenamento de dados no sistema SAP. Cada transação processada no SAP, de uma entrada de mercadorias a uma fatura ou ordem de venda, é armazenada em um conjunto de tabelas estruturadas no banco de dados relacional subjacente (como HANA, Oracle ou SQL Server). Essas tabelas contêm os dados brutos e transacionais da sua empresa. Nas versões modernas dos sistemas SAP, há uma representação individual das tabelas ABAP para as tabelas do banco de dados. Em versões mais antigas, isso nem sempre é o caso, e o acesso a tabelas de pool/cluster no nível do banco de dados não é possível. O uso de tabelas requer um conhecimento profundo do modelo de dados da SAP, caso contrário, corre-se o risco de interpretar mal o contexto de negócios.

Visualizações/extratores do Core Data Services

As visualizações e extratores do Core Data Services (CDS) fornecem uma visão multidimensional orientada para os negócios dos dados transacionais diretamente no sistema SAP operacional. Essas fontes oferecem uma lógica predefinida que reflete como os dados são usados em processos diários, como vendas, compras ou finanças. Em vez de acessar tabelas brutas, as Visualizações e Extratores CDS expõem os dados de uma forma alinhada com o significado comercial. Por exemplo, mostrando apenas ordens ativas ou incluindo descrições relevantes e campos calculados.

Armazém de Negócios InfoObjects / InfoProviders

InfoObjects e InfoProviders fazem parte da camada semântica do SAP Business Warehouse (BW). Eles formam o modelo multidimensional baseado em fatos e dimensões para usar na modelagem e relatórios em todas as camadas da arquitetura BW. À medida que os dados se movem pelas camadas, eles são continuamente transformados, limpos e enriquecidos. Como resultado, os dados no data mart final são consistentes e preparados para uso em painéis e relatórios corporativos.

Consultas BW

As consultas são a principal interface para consumir dados armazenados no SAP BW. Eles definem métricas prontas para os negócios, como as principais medidas de receita, custo ou quantidade, aplicando cálculos, filtros e agregações sobre InfoProviders. As consultas também são totalmente integradas ao modelo de autorização da SAP e otimizadas para desempenho.

Escolha a fonte de dados certa

Selecionar a fonte de dados certa depende do objetivo final e da quantidade de transformação existente que você deseja reutilizar. Como explicado na seção anterior, os sistemas SAP oferecem várias camadas de acesso a dados, cada uma adequada a diferentes estágios da jornada de dados, desde transações brutas até métricas de negócios totalmente modeladas. Os dados transacionais são armazenados de forma altamente normalizada, o que significa que as informações são divididas em muitas tabelas menores relacionadas para reduzir a redundância e melhorar a eficiência. Essas tabelas refletem a saída bruta dos processos de negócios, exatamente como ela é gerada no sistema. Esse design promove a integridade dos dados, mas torna os relatórios e as análises mais complexos.

Ao passar de tabelas base para camadas mais altas, cada etapa adiciona mais estrutura, consistência e alinhamento com o significado comercial. As visualizações CDS e os extratores BW moldam os dados transacionais em formato multidimensional, aplicando junções básicas, filtros e lógica de negócios para simplificar análises e relatórios. Esses objetos podem apresentar diferentes perspetivas sobre os mesmos dados subjacentes, dependendo da necessidade de relatório. Por exemplo, uma exibição pode se concentrar em ordens de venda abertas, enquanto outra destaca os itens entregues. Essa flexibilidade permite que o mesmo conjunto de dados ofereça suporte a vários cenários analíticos sem duplicar os dados brutos.

Ao longo da jornada de dados, os objetos BW assumem a responsabilidade de armazenar, estruturar e preparar dados para relatórios corporativos. InfoObjects e InfoProviders juntos formam uma base padronizada para análises entre departamentos e ferramentas. Na parte superior, as consultas expõem conjuntos de dados selecionados, completos com filtros, cálculos e índices predefinidos, prontos para serem consumidos por painéis e plataformas de análise externas.

Como recomendação geral, quanto maior o nível de acesso na pilha de dados, mais conteúdo e lógica de negócios poderá reutilizar. Em vez de unir manualmente tabelas base para criar uma exibição consolidada de ordens de venda, você pode aplicar objetos dedicados fornecidos pelo SAP, que já incluem junções, filtros e mapeamentos de campo relevantes. Essa abordagem reduz significativamente o esforço de desenvolvimento e garante a consistência com a forma como os dados são usados no sistema. No entanto, isso também significa aceitar as transformações internas, como filtrar determinados status do documento. Se outros campos forem necessários, as alterações devem ser feitas no nível de origem, por exemplo, estendendo a visualização do CDS.

A tabela a seguir fornece exemplos de cenários comuns e recomenda a fonte de dados SAP mais adequada em cada caso. O uso de um objeto específico é uma decisão de design e deve sempre ser avaliado com base nas opções disponíveis, requisitos de dados e recursos do sistema.

Cenário / Intenção Fonte de dados recomendada
Quero acessar tabelas transacionais brutas e aplicar transformações personalizadas e lógica de negócios por conta própria. Tabelas SAP
Não tenho conhecimento detalhado do modelo de dados subjacente do SAP e quero reutilizar a estrutura e os relacionamentos existentes do sistema transacional. Visualizações CDS / Extratores BW
Preciso criar painéis com base em dados transacionais, mas prefiro trabalhar com um modelo curado e alinhado aos negócios. Visualizações CDS / Extratores BW
Minha organização já tem um sistema BW com modelos de dados validados, e quero usá-los como base para relatórios. BW InfoObjects / InfoProvedores
Preciso de uma camada de relatórios segura com restrições predefinidas e números-chave específicos do negócio, prontos para consumo em ferramentas de BI. Consultas BW

Resumo das opções de conectividade

A tabela a seguir resume as opções de conectividade disponíveis para sistemas SAP.

Connector Fontes Caso de uso Solução ETL
SAP BW (Servidor de Aplicações ou Servidor de Mensagens) SAP BW, SAP BW/4HANA
SAP S/4HANA
Acesso à camada analítica multidimensional Microsoft Fabric (Dataflow Gen2)
SAP HANA SAP HANA, SAP HANA Nuvem
Esfera de dados SAP
SAP BW-on-HANA
SAP BW/4HANA
Acesso à camada analítica multidimensional
Acesso a artefatos SQL (tabelas, exibições)
Acesso às visualizações de cálculo do HANA expostas pelo SAP BW-on-HANA ou BW/4HANA
Microsoft Fabric (Dataflow Gen2,
Gasoduto,
Copiar trabalho)
Tabela SAP (Servidor de Aplicativos ou Servidor de Mensagens) SAP S/4HANA
SAP ECC
Tabelas do dicionário de dados SAP (DDIC), visualizações
Visualizações do ABAP CDS
Microsoft Fabric (Pipeline)
SAP CDC SAP S/4HANA
SAP ECC
Tabelas do dicionário de dados SAP (DDIC), visualizações
Visualizações do ABAP CDS
Azure Data Factory (fluxo de dados)
SAP BW OpenHub (Servidor de Aplicações ou Servidor de Mensagens) SAP BW Acesso aos dados em BW InfoProviders (ADSOs) Microsoft Fabric (Pipeline)
OData SAP SuccessFactors
SAP C4C
SAP S/4HANA
SAP ECC
Serviços OData Microsoft Fabric (Dataflow Gen2,
Gasoduto)
ODBC SAP HANA, SAP HANA Nuvem
Esfera de dados SAP
Acesso a artefatos SQL (tabelas, exibições) Microsoft Fabric (Dataflow Gen2, Pipeline)
Espelhamento aberto SAP S/4HANA
SAP ECC
(com base em recursos de terceiros)
Tabelas do dicionário de dados SAP (DDIC), visualizações
Visualizações do ABAP CDS
Microsoft Fabric
Integração Premium Outbound SAP S/4HANA
SAP ECC
SAP BW, SAP BW/4HANA (e outras soluções de acordo com as opções de conectividade do Datasphere)
Tabelas do dicionário de dados SAP (DDIC), visualizações
Visualizações do ABAP CDS
SAP ODP
Esfera de dados SAP

Ferramentas e soluções de extração de dados SAP

Esta seção fornece uma visão geral das ferramentas e soluções disponíveis para você considerar ao extrair dados SAP para o Microsoft Fabric.

Extração de dados SAP usando o Microsoft Fabric

Você pode usar pipelines e fluxos de dados no Microsoft Fabric para extrair e transformar dados de várias fontes de dados SAP.

Figura 1: Opções de conectividade de dados SAP no Microsoft Fabric.

O diagrama mostra as opções de conectividade de dados SAP no Microsoft Fabric.

Conector de tabela SAP

O conector SAP Table se conecta a sistemas SAP baseados em ABAP e permite a extração de snapshots de dados de tabela. Ele suporta filtragem de dados usando uma sintaxe simples semelhante ao ABAP. Para volumes de dados maiores, você pode aplicar particionamento interno com base em colunas selecionadas, como o carimbo de data/hora de lançamento, para dividir a tabela em partes menores. O conector está disponível por meio de pipelines no Microsoft Fabric.

Conector SAP HANA

O conector SAP HANA permite que você se conecte ao banco de dados SAP HANA. Ele suporta duas camadas de acesso: a camada analítica multidimensional baseada em exibições de cálculo HANA e a camada transacional que fornece acesso a dados armazenados em tabelas e exibições.

Ao se conectar por meio do Dataflow Gen2, projetado para modelagem semântica e análise, o conector SAP HANA normalmente acessa a camada multidimensional. As visualizações de cálculo funcionam de forma semelhante às consultas SAP BW e geralmente são usadas para acessar diretamente dados e KPIs selecionados seguindo uma lógica integrada.

Por outro lado, quando o conector é usado em um pipeline do Microsoft Fabric, criado para ETL e ingestão de dados em grande escala, ele assume como padrão acessar tabelas de banco de dados e exibições SQL. Essa abordagem funciona bem ao trabalhar com grandes quantidades de dados graças a outros recursos de particionamento de dados que permitem que grandes conjuntos de dados sejam divididos e processados em paralelo, melhorando o desempenho e a escalabilidade.

ODBC Genérico

A conectividade ODBC genérica permite a conectividade com uma ampla gama de bancos de dados, incluindo, entre outros, o SAP HANA. Ele fornece acesso flexível a tabelas e exibições subjacentes que o tornam adequado para cenários onde o acesso direto a dados brutos e transacionais é necessário. Quando usado com um banco de dados SAP HANA, o conector ODBC genérico se conecta à camada transacional, permitindo que os usuários consultem dados de tabelas base e exibições SQL.

Conector SAP BW

O conector SAP BW foi projetado para acessar a camada analítica multidimensional em sistemas SAP. Ele é usado para fornecer conjuntos de dados prontos para os negócios e contém medidas, hierarquias, filtros e autorizações predefinidas, tornando os dados fáceis de interpretar e consumir em ferramentas de relatórios e análises. O conector fornece uma maneira confiável de extrair dados com curadoria e semanticamente ricos, que se alinha estreitamente com os padrões de relatórios corporativos. O conector suporta consultas BW do SAP BW e BW/4HANA, e a camada analítica incorporada no SAP S/4HANA, que você pode usar para acessar o SAP CDS Views.

SAP BW OpenHub

O conector SAP BW OpenHub permite a extração de dados de destinos OpenHub em sistemas SAP BW. Os destinos do OpenHub são usados para expor dados gerenciados por BW para consumo externo. Qualquer objeto suportado pelo SAP Data Transfer Process (DTP) pode servir como fonte para o OpenHub, incluindo DataStore Objects (DSOs), InfoCubes e DataSources. Isso o torna uma opção flexível para exportar dados estruturados e transformados.

O conector suporta extração delta, que captura apenas registros que foram alterados desde a última carga bem-sucedida. A manipulação delta é gerenciada pelo sistema SAP BW com base na lógica definida no DTP, normalmente usando carimbos de data/hora, IDs de solicitação ou posições de log de alteração. Uma vez configurado, o sistema aplica a lógica delta automaticamente, reduzindo a necessidade de rastreamento manual ou implementação personalizada.

Conector OData

A extração de dados também pode ser tratada por serviços OData, que expõem dados de negócios de sistemas SAP por meio de um protocolo padronizado baseado em REST. Essa abordagem é adequada para acessar dados disponibilizados por meio de serviços SAP Gateway, como os do SAP S/4HANA e SAP Business Suite. A SAP fornece um rico conjunto de serviços OData pré-configurados que abrangem muitos objetos e processos de negócios principais. Além disso, as visualizações CDS personalizadas ou padrão podem ser expostas como pontos de extremidade OData, que oferecem uma maneira flexível de recuperar dados semanticamente ricos e bem estruturados.

Extração de dados SAP usando o Azure Data Factory

O Azure Data Factory é um serviço de integração de dados baseado em nuvem que permite criar e agendar pipelines para mover e transformar dados em diversos sistemas. Muitos conectores de dados, incluindo conectores específicos do SAP, como SAP Table e SAP BW, já estão disponíveis no Microsoft Fabric. Se a integração SAP for uma nova carga de trabalho que você planeja integrar e estiver considerando o Microsoft Fabric para análise, é altamente recomendável usá-lo também para integração de dados. Dessa forma, você se beneficia de uma experiência mais unificada em ingestão, transformação e análise de dados, tudo em uma única plataforma. No entanto, se você já tiver pipelines SAP incorporados no Azure Data Factory ou precisar usar o conector SAP CDC, não haverá necessidade imediata de replataforma. Os pipelines e fluxos de dados existentes podem ser integrados ao OneLake.

Figura 2: Opções de conectividade de dados do SAP para Microsoft Fabric no Azure Data Factory.

O diagrama mostra as opções de conectividade de dados do SAP para o Microsoft Fabric no Azure Data Factory.

Conector SAP CDC

O conector SAP CDC permite a extração incremental de dados de sistemas SAP usando a estrutura SAPOperational Data Provisioning , disponível em ambientes ABAP. A estrutura ODP rastreia automaticamente os deltas no sistema de origem e os armazena em uma fila delta. Cada vez que o conector é executado, ele recupera apenas os registros novos ou alterados desde a última extração, com base em uma assinatura mantida pela estrutura.

Ele suporta uma ampla gama de fontes de dados SAP, incluindo:

  • Extratores BW
  • Visualizações dos Serviços de Dados Principais (CDS)
  • Transformação do cenário SAP (SLT)
  • BW InfoProvedores
  • Visualizações de informações do SAP HANA

Ele também suporta filtragem de dados e particionamento para otimizar o desempenho e controlar o volume de dados durante a extração.

Quando o destino é um armazenamento de dados relacional, o conector SAP CDC aplica automaticamente inserções, atualizações e exclusões para manter o destino sincronizado com a origem. Esse processo de mesclagem delta integrado garante que os sistemas downstream sempre reflitam o estado mais recente dos dados SAP sem a necessidade de reconciliação manual.

Observação

Embora a Microsoft ofereça suporte total ao conector SAP CDC como uma solução confiável para extração de dados, antes de usar o conector SAP CDC, consulte a Nota SAP relevante: 3255746 - Uso não permitido de APIs de replicação de dados ODP para determinar se é relevante para seu licenciamento SAP atual.

Saiba mais sobre o conector SAP CDC no Azure Data Factory

Extração de dados SAP usando SAP Datasphere

O SAP Datasphere é a solução de nível empresarial da SAP para extrair e transformar dados em sistemas heterogêneos. Ele suporta conexões com serviços de terceiros e permite estratégias flexíveis de movimentação de dados adaptadas às necessidades da empresa.

Figura 3: Opções de conectividade de dados SAP para Microsoft Fabric no SAP Datasphere.

O diagrama mostra as opções de conectividade de dados do SAP para o Microsoft Fabric no SAP Datasphere.

Integração Premium Outbound

Usando a Integração de Saída Premium, os clientes podem configurar fluxos de replicação para extrair dados de sistemas de origem SAP e ingeri-los no Azure Data Lake Gen2. A fonte de dados pode ser um objeto dentro do SAP Datasphere, mas essa integração também permite que os dados sejam extraídos diretamente do sistema de origem sem serem armazenados no SAP Datasphere.

Depois que os dados chegarem ao Azure Data Lake Gen2, eles poderão ser expostos no Microsoft Fabric lakehouses usando atalhos. Esses atalhos fornecem acesso contínuo e somente leitura aos dados ingeridos sem duplicar o armazenamento, permitindo fluxos de trabalho poderosos de análise e transformação diretamente no Fabric.

Conexão ODBC

A conectividade ODBC permite que os clientes consumam visualizações no SAP Datasphere diretamente de notebooks Spark no Microsoft Fabric, permitindo exploração, transformação e análise avançada de dados em tempo real sem a necessidade de replicação. O conector SAP HANA também pode ser usado para ingerir dados em lakehouses do Microsoft Fabric usando pipelines e fluxos de dados.

Soluções de parceiros

Um ecossistema crescente de parceiros confiáveis traz experiência especializada na extração de dados de ambientes SAP complexos, como SAP S/4HANA e SAP BW/4HANA, para o Microsoft Fabric. Esses parceiros vão além dos conectores padrão, fornecendo complementos personalizados que atendem aos requisitos específicos da empresa.

Solução de parceiro Espelhamento aberto Integração Lakehouse Certificação
DAB Suportado Suportado Ligação
ASAPIO Suportado Suportado Ligação
Teobaldo Suportado Suportado Ligação
Implementar Suportado Suportado Ligação
Cola SNP Suportado Suportado Ligação

Saiba mais sobre as soluções de parceiros que suportam o Open Mirroring.

Figura 4: Opções de conectividade de dados SAP para Microsoft Fabric usando soluções de parceiros.

O diagrama mostra as opções de conectividade de dados do SAP para o Microsoft Fabric usando soluções de parceiros.

As soluções de parceiros geralmente suportam dois padrões de integração:

Espelhamento aberto

As soluções de parceiros aplicam um conjunto de APIs nativas do Microsoft Fabric para sincronizar conjuntos de dados de origem com bancos de dados espelhados no Fabric. Essa abordagem garante que as tabelas de destino permaneçam uma cópia consistente e up-toda origem, à medida que o mecanismo de espelhamento processa e mescla automaticamente as alterações.

Saiba mais sobre o Open Mirroring no Microsoft Fabric.

Lakehouse

A integração direta do lakehouse permite que os parceiros ingeram dados no Fabric nos modos completo e incremental. Embora esse método ofereça flexibilidade e controle, geralmente requer outro processamento para lidar com a desduplicação e a consolidação de registros antes que os dados estejam prontos para análise downstream.

Recursos

SAP Knowledge Center – integração de dados

Visão geral e arquitetura dos recursos do SAP CDC

Novidades da conectividade SAP no Microsoft Fabric – julho de 2025