Compartilhar via


Extrair dados do SAP para o Microsoft Fabric

Neste artigo, você obterá uma compreensão abrangente das diferentes fontes de dados e ferramentas disponíveis para extração de dados sap e como selecionar a opção mais apropriada com base em suas metas analíticas. O conteúdo aborda a estrutura e a finalidade de cada camada de dados em sistemas SAP. Ele também destaca os recursos de integração com o Microsoft Fabric e as considerações sobre confiabilidade, desempenho e alinhamento de negócios.

O Microsoft Fabric é uma plataforma de dados totalmente integrada e baseada em SaaS que unifica engenharia de dados, análise em tempo real, ciência de dados, business intelligence e governança em uma única experiência. Baseado no OneLake, o Fabric centraliza o armazenamento de dados e permite a colaboração perfeita entre funções, desde engenheiros de dados até usuários empresariais. Em sua essência está o OneLake, um data lake unificado que centraliza o armazenamento e permite o acesso contínuo a dados entre serviços. O Fabric também integra os recursos de IA por meio do Copilot e do Azure AI Studio, capacitando os usuários a derivar insights de forma mais rápida e intuitiva. Projetado para simplicidade, escalabilidade e colaboração, o Microsoft Fabric ajuda as organizações a simplificar seus fluxos de trabalho de análise, reduzir a complexidade e acelerar sua jornada de transformação de IA

As empresas estão cada vez mais adotando o Microsoft Fabric como base de seu cenário de dados para unificar aplicativos de negócios, telemetria de IoT e cargas de trabalho de IA. Ao consolidar todas as cargas de trabalho de análise em um único ambiente, o Microsoft Fabric acelera a entrega de insights e elimina silos de dados. Os sistemas SAP são uma das fontes de dados mais críticas, pois contêm dados que dão suporte a operações de negócios principais e também podem ser integrados à plataforma unificada. Essa integração enriquece os dados corporativos e permite uma visão mais holística do desempenho dos negócios. Você pode criar painéis poderosos que exploram tendências e destacam problemas, refletindo processos de negócios de ponta a ponta usando dados de sistemas e departamentos, independentemente de sua origem. Isso é possível por ter todos os dados relevantes unificados em uma única plataforma.

Importante

Antes de iniciar as extrações de dados de sistemas SAP, sempre verifique os direitos de licenciamento sap da sua organização. Determinados métodos de extração podem exigir outras licenças ou direitos de uso específicos.

Fontes de dados no sistema SAP

O SAP oferece várias camadas de acesso a dados, cada uma atendendo a diferentes necessidades analíticas e de relatórios. Esta seção apresenta os principais tipos de fontes de dados disponíveis em um cenário SAP, explicando o que elas são e como funcionam.

Tabelas e visões

As tabelas SAP são a camada fundamental do armazenamento de dados no sistema SAP. Cada transação processada no SAP, desde um recibo de mercadorias até uma fatura ou pedido de vendas, é armazenada em um conjunto de tabelas estruturadas no banco de dados relacional subjacente (como HANA, Oracle ou SQL Server). Essas tabelas contêm os dados transacionais brutos da sua empresa. Em versões modernas de sistemas SAP, há uma representação um-para-um das tabelas ABAP para as tabelas de banco de dados. Em versões mais antigas, nem sempre é possível acessar tabelas de pool/cluster no nível do banco de dados. O uso de tabelas requer um conhecimento aprofundado do modelo de dados do SAP, caso contrário, você corre o risco de interpretar mal o contexto de negócios.

Exibições/extratores do Core Data Services

As exibições e extratores do CDS (Core Data Services) fornecem uma exibição multidimensional e orientada a negócios de dados transacionais diretamente no sistema SAP operacional. Essas fontes oferecem uma lógica predefinida que reflete como os dados são usados em processos diários, como vendas, compras ou finanças. Em vez de acessar tabelas brutas, exibições de CDS e extratores expõem dados de uma maneira que se alinha com o significado dos negócios. Por exemplo, mostrando apenas pedidos ativos ou incluindo descrições relevantes e campos calculados.

Business Warehouse InfoObjects /InfoProviders

InfoObjects e InfoProviders fazem parte da camada semântica do SAP Business Warehouse (BW). Eles formam o modelo multidimensional com base em fatos e dimensões a serem usados em modelagem e relatórios em todas as camadas da arquitetura BW. À medida que os dados se movem pelas camadas, eles são transformados, limpos e enriquecidos continuamente. Como resultado, os dados no data mart final são consistentes e preparados para uso em dashboards e relatórios corporativos.

Consultas BW

As consultas são a interface principal para consumir dados armazenados no SAP BW. Eles definem métricas prontas para os negócios, como as principais medidas de receita, custo ou quantidade aplicando cálculos, filtros e agregações em cima de InfoProviders. As consultas também são fortemente integradas ao modelo de autorização do SAP e otimizadas para desempenho.

Escolher a fonte de dados certa

Selecionar a fonte de dados certa depende do objetivo final e de quanto da transformação existente você deseja reutilizar. Conforme explicado na seção anterior, os sistemas SAP oferecem várias camadas de acesso a dados, cada uma adequada para diferentes estágios no percurso de dados, desde transações brutas até métricas de negócios totalmente modeladas. Os dados transacionais são armazenados em uma forma altamente normalizada, o que significa que as informações são divididas entre muitas tabelas menores e relacionadas para reduzir a redundância e melhorar a eficiência. Essas tabelas refletem a saída bruta de processos de negócios exatamente como é gerada no sistema. Esse design promove a integridade dos dados, mas torna os relatórios e análises mais complexos.

Ao mover de tabelas base para camadas mais altas, cada etapa adiciona mais estrutura, consistência e alinhamento com o significado dos negócios. Exibições de CDS e Extratores BW moldam os dados transacionais em formato multidimensional aplicando junções básicas, filtros e lógica de negócios para simplificar a análise e os relatórios. Esses objetos podem apresentar perspectivas diferentes sobre os mesmos dados subjacentes, dependendo da necessidade de relatório. Por exemplo, um modo de exibição pode se concentrar em pedidos de vendas abertos, enquanto outro realça os itens entregues. Essa flexibilidade permite que o mesmo conjunto de dados dê suporte a vários cenários analíticos sem duplicar os dados brutos.

Além da jornada de dados, os objetos BW assumem a responsabilidade de armazenar, estruturar e preparar dados para relatórios corporativos. InfoObjects e InfoProviders juntos formam uma base padronizada para análise entre departamentos e ferramentas. Na parte superior, as consultas expõem conjuntos de dados coletados, completos com filtros predefinidos, cálculos e figuras-chave, prontos para serem consumidos por painéis e plataformas de análise externa.

Como recomendação geral, quanto maior o nível de acesso na pilha de dados, mais conteúdo e lógica de negócios você pode reutilizar. Em vez de unir manualmente tabelas base para criar uma exibição consolidada de pedidos de vendas, você pode aplicar objetos dedicados entregues pelo SAP, que já incluem junções, filtros e mapeamentos de campo relevantes. Essa abordagem reduz significativamente o esforço de desenvolvimento e garante a consistência com a forma como os dados são usados dentro do sistema. No entanto, também significa aceitar as transformações internas, como filtrar determinados status de documento. Se outros campos forem necessários, as alterações deverão ser feitas no nível de origem, por exemplo, estendendo a exibição do CDS.

A tabela a seguir fornece exemplos de cenários comuns e recomenda a fonte de dados SAP mais adequada em cada caso. O uso de um objeto específico é uma decisão de design e sempre deve ser avaliado com base em opções disponíveis, requisitos de dados e recursos do sistema.

Cenário/Intenção Fonte de dados recomendada
Quero acessar tabelas transacionais brutas e aplicar transformações personalizadas e lógica de negócios por conta própria. Tabelas SAP
Não tenho conhecimento detalhado do modelo de dados subjacente do SAP e quero reutilizar a estrutura e as relações existentes do sistema transacional. Exibições de CDS /Extratores BW
Preciso criar painéis com base em dados transacionais, mas prefiro trabalhar com um modelo alinhado aos negócios. Exibições de CDS /Extratores BW
Minha organização já tem um sistema BW com modelos de dados validados e quero usá-los como base para relatórios. BW InfoObjects /InfoProviders
Preciso de uma camada de relatório segura com restrições predefinidas e figuras-chave específicas para os negócios, prontas para consumo em ferramentas de BI. Consultas BW

Resumo das opções de conectividade

A tabela a seguir resume as opções de conectividade disponíveis para sistemas SAP.

Connector Fontes Caso de uso Solução ETL
SAP BW (Servidor de Aplicativos ou Servidor de Mensagens) SAP BW, SAP BW/4HANA
SAP S/4HANA
Acesso à camada de análise multidimensional Microsoft Fabric (Dataflow Gen2)
SAP HANA SAP HANA, SAP HANA Cloud
SAP Datasphere
SAP BW-on-HANA
SAP BW/4HANA
Acesso à camada de análise multidimensional
Acesso a artefatos SQL (tabelas, exibições)
Acesso a exibições de cálculo do HANA expostas pelo SAP BW-on-HANA ou BW/4HANA
Microsoft Fabric (Dataflow Gen2,
Pipeline
Copiar Trabalho)
Tabela SAP (Servidor de Aplicativos ou Servidor de Mensagens) SAP S/4HANA
SAP ECC
Tabelas do dicionário de dados SAP (DDIC), exibições
Exibições de CDS do ABAP
Microsoft Fabric (Pipeline)
SAP CDC SAP S/4HANA
SAP ECC
Tabelas do dicionário de dados SAP (DDIC), exibições
Exibições de CDS do ABAP
Azure Data Factory (fluxo de dados)
SAP BW OpenHub (Servidor de Aplicativos ou Servidor de Mensagens) SAP BW Acesso a dados no BW InfoProviders (ADSOs) Microsoft Fabric (Pipeline)
OData SAP SuccessFactors
SAP C4C
SAP S/4HANA
SAP ECC
Serviços OData Microsoft Fabric (Dataflow Gen2,
Pipeline)
ODBC SAP HANA, SAP HANA Cloud
SAP Datasphere
Acesso a artefatos SQL (tabelas, exibições) Microsoft Fabric (Dataflow Gen2, Pipeline)
Abrir espelhamento SAP S/4HANA
SAP ECC
(com base em recursos de terceiros)
Tabelas do dicionário de dados SAP (DDIC), exibições
Exibições de CDS do ABAP
Microsoft Fabric
Integração de saída Premium SAP S/4HANA
SAP ECC
SAP BW, SAP BW/4HANA (e outras soluções de acordo com as opções de conectividade do Datasphere)
Tabelas do dicionário de dados SAP (DDIC), exibições
Exibições de CDS do ABAP
SAP ODP
SAP Datasphere

Ferramentas e soluções de extração de dados SAP

Esta seção fornece uma visão geral das ferramentas e soluções disponíveis para você considerar ao extrair dados sap para o Microsoft Fabric.

Extração de dados SAP usando o Microsoft Fabric

Você pode usar pipelines e fluxos de dados no Microsoft Fabric para extrair e transformar dados de várias fontes de dados SAP.

Figura 1: opções de conectividade de dados SAP no Microsoft Fabric.

O diagrama mostra as opções de conectividade de dados SAP no Microsoft Fabric.

Conector de tabela SAP

O conector de Tabela SAP conecta-se a sistemas SAP baseados em ABAP e permite a extração de instantâneos de dados de tabela. Ele dá suporte à filtragem de dados usando uma sintaxe simples semelhante a ABAP. Para volumes de dados maiores, você pode aplicar o particionamento interno com base em colunas selecionadas, como postagem de carimbo de data/hora para dividir a tabela em partes menores. O conector está disponível por meio de pipelines no Microsoft Fabric.

Conector do SAP HANA

O conector do SAP HANA permite que você se conecte ao banco de dados SAP HANA. Ele dá suporte a duas camadas de acesso: a camada de análise multidimensional baseada em exibições de cálculo do HANA e a camada transacional que fornece acesso aos dados armazenados em tabelas e exibições.

Ao se conectar por meio do Dataflow Gen2, projetado para modelagem semântica e análise, o conector sap HANA normalmente acessa a camada multidimensional. As exibições de cálculo funcionam de forma semelhante às consultas SAP BW e geralmente são usadas diretamente para acessar dados coletados e KPIs seguindo a lógica interna.

Por outro lado, quando o conector é usado em um pipeline do Microsoft Fabric, criado para etl e ingestão de dados em grande escala, ele usa como padrão o acesso a tabelas de banco de dados e exibições SQL. Essa abordagem funciona bem ao trabalhar com grandes quantidades de dados graças a outros recursos de particionamento de dados que permitem que grandes conjuntos de dados sejam divididos e processados em paralelo, melhorando o desempenho e a escalabilidade.

ODBC genérico

A conectividade ODBC genérica permite a conectividade com uma ampla gama de bancos de dados, incluindo, mas não limitado ao SAP HANA. Ele fornece acesso flexível a tabelas e exibições subjacentes que o tornam adequado para cenários em que o acesso direto a dados transacionais brutos é necessário. Quando usado com um banco de dados SAP HANA, o conector ODBC genérico se conecta à camada transacional, permitindo que os usuários consultem dados de tabelas base e exibições SQL.

Conector do SAP BW

O conector SAP BW foi projetado para acessar a camada de análise multidimensional em sistemas SAP. Ele é usado para fornecer conjuntos de dados prontos para negócios e contém medidas predefinidas, hierarquias, filtros e autorizações, tornando os dados fáceis de interpretar e consumir em ferramentas de relatório e análise. O conector fornece uma maneira confiável de extrair dados coletados e semanticamente avançados, que se alinham de perto com os padrões de relatórios corporativos. O conector dá suporte a consultas BW do SAP BW e BW/4HANA e à camada analítica inserida no SAP S/4HANA, que você pode usar para acessar exibições do SAP CDS.

SAP BW OpenHub

O conector do SAP BW OpenHub permite a extração de dados de destinos do OpenHub em sistemas SAP BW. Os destinos do OpenHub são usados para expor dados gerenciados por BW para consumo externo. Qualquer objeto compatível com o DTP (Processo de Transferência de Dados) do SAP pode servir como uma fonte para o OpenHub, incluindo DSOs (Objetos DataStore), InfoCubes e DataSources. Isso o torna uma opção flexível para exportar dados estruturados e transformados.

O conector dá suporte à extração delta, que captura apenas registros que foram alterados desde a última carga bem-sucedida. A manipulação delta é gerenciada pelo sistema SAP BW com base na lógica definida no DTP, normalmente usando carimbos de data/hora, IDs de solicitação ou posições de log de alteração. Depois de configurado, o sistema aplica a lógica delta automaticamente, reduzindo a necessidade de acompanhamento manual ou implementação personalizada.

Conector OData

A extração de dados também pode ser tratada pelos serviços OData, que expõem dados comerciais de sistemas SAP por meio de um protocolo padronizado baseado em REST. Essa abordagem é adequada para acessar dados disponibilizados por meio de serviços do SAP Gateway, como os do SAP S/4HANA e do SAP Business Suite. O SAP fornece um conjunto avançado de serviços OData pré-configurados que abrangem muitos objetos e processos de negócios principais. Além disso, exibições de CDS personalizadas ou padrão podem ser expostas como pontos de extremidade OData, que oferecem uma maneira flexível de recuperar dados semanticamente ricos e bem estruturados.

Extração de dados SAP usando o Azure Data Factory

O Azure Data Factory é um serviço de integração de dados baseado em nuvem que permite criar e agendar pipelines para mover e transformar dados em diversos sistemas. Muitos conectores de dados, incluindo os específicos do SAP, como o SAP Table e o SAP BW, já estão disponíveis no Microsoft Fabric. Se a integração do SAP for uma nova carga de trabalho que você planeja integrar e estiver considerando o Microsoft Fabric para análise, é altamente recomendável usá-la também para integração de dados. Dessa forma, você se beneficia de uma experiência mais unificada na ingestão, transformação e análise de dados em uma única plataforma. No entanto, se você já tiver pipelines SAP integrados no Azure Data Factory ou precisar usar o conector SAP CDC, não haverá necessidade imediata de replatar. Pipelines e fluxos de dados existentes podem ser integrados ao OneLake.

Figura 2: opções de conectividade de dados sap para Microsoft Fabric no Azure Data Factory.

O diagrama mostra as opções de conectividade de dados do SAP para o Microsoft Fabric no Azure Data Factory.

Conector SAP CDC

O conector SAP CDC permite a extração incremental de dados de sistemas SAP usando a estrutura de Provisionamento de Dados Operacionaissap, disponível em ambientes ABAP. A estrutura ODP controla automaticamente os deltas no sistema de origem e armazena-os em uma fila delta. Sempre que o conector é executado, ele recupera apenas os registros novos ou alterados desde a última extração, com base em uma assinatura mantida pela estrutura.

Ele dá suporte a uma ampla gama de fontes de dados SAP, incluindo:

  • Extratores BW
  • Exibições do CDS (Core Data Services)
  • Sap Landscape Transformation (SLT)
  • BW InfoProviders
  • Exibições de informações do SAP HANA

Ele também dá suporte à filtragem e ao particionamento de dados para otimizar o desempenho e controlar o volume de dados durante a extração.

Quando o destino é um armazenamento de dados relacional, o conector SAP CDC aplica automaticamente inserções, atualizações e exclusões para manter o destino sincronizado com a origem. Esse processo de mesclagem delta interno garante que os sistemas downstream sempre reflitam o estado mais recente dos dados SAP sem a necessidade de reconciliação manual.

Observação

Embora a Microsoft dê suporte total ao conector SAP CDC como uma solução confiável para extração de dados, antes de usar o conector SAP CDC, consulte a nota SAP relevante: 3255746 – uso não permitido de APIs de Replicação de Dados ODP para determinar se ele é relevante para o licenciamento sap atual.

Saiba mais sobre o conector SAP CDC no Azure Data Factory

Extração de dados SAP usando o SAP Datasphere

O SAP Datasphere é a solução de nível empresarial da SAP para extrair e transformar dados em sistemas heterogêneos. Ele dá suporte a conexões com serviços de terceiros e permite estratégias flexíveis de movimentação de dados adaptadas às necessidades da empresa.

Figura 3: opções de conectividade de dados sap para Microsoft Fabric no SAP Datasphere.

O diagrama mostra as opções de conectividade de dados do SAP para o Microsoft Fabric no SAP Datasphere.

Integração de saída Premium

Usando a Integração de Saída Premium, os clientes podem configurar fluxos de replicação para extrair dados de sistemas de origem SAP e ingeri-los no Azure Data Lake Gen2. A fonte de dados pode ser um objeto no SAP Datasphere, mas essa integração também permite que os dados sejam extraídos diretamente do sistema de origem sem serem armazenados no SAP Datasphere.

Depois que os dados chegam ao Azure Data Lake Gen2, eles podem ser expostos em lakehouses do Microsoft Fabric usando atalhos. Esses atalhos fornecem acesso contínuo e somente leitura aos dados ingeridos sem duplicar o armazenamento, permitindo fluxos de trabalho de análise e transformação avançados diretamente no Fabric.

Conexão ODBC

A conectividade ODBC permite que os clientes consumam exibições no SAP Datasphere diretamente dos notebooks Spark no Microsoft Fabric, permitindo a exploração, a transformação e a análise avançada em tempo real sem a necessidade de replicação. O conector do SAP HANA também pode ser usado para ingerir dados em lakehouses do Microsoft Fabric usando pipelines e fluxos de dados.

Soluções de parceiros

Um ecossistema crescente de parceiros confiáveis traz conhecimento especializado na extração de dados de ambientes sap complexos, como SAP S/4HANA e SAP BW/4HANA no Microsoft Fabric. Esses parceiros vão além dos conectores padrão, fornecendo complementos personalizados que abordam requisitos específicos da empresa.

Solução de parceiro Abrir espelhamento Integração do Lakehouse Certificação
DAB Suportado Suportado Link
ASAPIO Suportado Suportado Link
Theobald Suportado Suportado Link
Simples Suportado Suportado Link
Associação SNP Suportado Suportado Link

Saiba mais sobre soluções de parceiros que dão suporte ao Open Mirroring.

Figura 4: opções de conectividade de dados sap para Microsoft Fabric usando soluções de parceiro.

O diagrama mostra as opções de conectividade de dados do SAP para o Microsoft Fabric usando soluções de parceiro.

As soluções de parceiros geralmente dão suporte a dois padrões de integração:

Abrir espelhamento

As soluções de parceiros aplicam um conjunto de APIs nativas do Microsoft Fabric para sincronizar conjuntos de dados de origem com bancos de dados espelhados no Fabric. Essa abordagem garante que as tabelas de destino permaneçam uma cópia consistente e up-todata da origem, pois o mecanismo de espelhamento processa e mescla automaticamente as alterações.

Saiba mais sobre o Open Mirroring no Microsoft Fabric.

Lakehouse

A integração direta do Lakehouse permite que os parceiros ingeram dados no Fabric em modos completos e incrementais. Embora esse método ofereça flexibilidade e controle, geralmente requer outro processamento para lidar com eliminação de duplicação e consolidação de registros antes que os dados estejam prontos para análise downstream.

Recursos

Central de Conhecimento sap – integração de dados

Visão geral e arquitetura dos recursos do SAP CDC

Novidades da conectividade SAP no Microsoft Fabric – julho de 2025