Compartir a través de


Extracción de datos de SAP en Microsoft Fabric

En este artículo, obtendrá una comprensión completa de los diferentes orígenes de datos y herramientas disponibles para la extracción de datos de SAP y cómo seleccionar la opción más adecuada en función de los objetivos analíticos. El contenido abarca la estructura y el propósito de cada capa de datos dentro de los sistemas SAP. También destaca las funcionalidades de integración para Microsoft Fabric y las consideraciones para la confiabilidad, el rendimiento y la alineación empresarial.

Microsoft Fabric es una plataforma de datos totalmente integrada basada en SaaS que unifica la ingeniería de datos, el análisis en tiempo real, la ciencia de datos, la inteligencia empresarial y la gobernanza en una sola experiencia. Basado en OneLake, Fabric centraliza el almacenamiento de datos y permite una colaboración sin problemas entre roles, desde ingenieros de datos a usuarios empresariales. En su núcleo es OneLake, un lago de datos unificado que centraliza el almacenamiento y permite el acceso sin problemas a los datos entre servicios. Fabric también integra las funcionalidades de inteligencia artificial a través de Copilot y Azure AI Studio, lo que permite a los usuarios derivar información de forma más rápida e intuitiva. Diseñado para simplificar, escalar y colaborar, Microsoft Fabric ayuda a las organizaciones a simplificar sus flujos de trabajo de análisis, reducir la complejidad y acelerar su recorrido de transformación de inteligencia artificial.

Las empresas adoptan cada vez más Microsoft Fabric como base de su panorama de datos para unificar las aplicaciones empresariales, la telemetría de IoT y las cargas de trabajo de inteligencia artificial. Al consolidar todas las cargas de trabajo de análisis en un único entorno, Microsoft Fabric acelera la entrega de información y elimina los silos de datos. Los sistemas SAP son uno de los orígenes de datos más críticos, ya que contienen datos que admiten operaciones empresariales principales y también se pueden integrar en la plataforma unificada. Esta integración enriquece los datos empresariales y permite una vista más holística del rendimiento empresarial. Puede crear paneles eficaces que exploren tendencias y resalte problemas, lo que refleja los procesos empresariales de un extremo a otro mediante datos de entre sistemas y departamentos, independientemente de su origen. Esto se hace posible al tener todos los datos pertinentes unificados en una sola plataforma.

Importante

Antes de comenzar las extracciones de datos de los sistemas SAP, compruebe siempre los derechos de licencia de SAP de su organización. Algunos métodos de extracción pueden requerir otras licencias o derechos de uso específicos.

Orígenes de datos en el sistema SAP

SAP ofrece varias capas de acceso a datos, cada una de las cuales atiende diferentes necesidades analíticas e informes. En esta sección se presentan los principales tipos de orígenes de datos disponibles en un entorno de SAP, que explican qué son y cómo funcionan.

Tablas y vistas

Las tablas de SAP son la capa fundamental del almacenamiento de datos en el sistema SAP. Cada transacción procesada en SAP, desde un recibo de mercancías a una factura o pedido de venta, se almacena en un conjunto de tablas estructuradas en la base de datos relacional subyacente (como HANA, Oracle o SQL Server). Estas tablas contienen los datos transaccionales sin procesar de su empresa. En las versiones modernas de los sistemas SAP hay una representación uno a uno de las tablas de ABAP en las tablas de base de datos. En versiones anteriores, no siempre es posible acceder a tablas de grupo o clúster en el nivel de base de datos. El uso de tablas requiere conocimientos detallados sobre el modelo de datos de SAP; de lo contrario, corre el riesgo de malinterpretar el contexto empresarial.

Vistas o extractores de Core Data Services

Las vistas y extractores de Core Data Services (CDS) proporcionan una vista multidimensional orientada al negocio de los datos transaccionales directamente dentro del sistema SAP operativo. Estos orígenes ofrecen lógica predefinida que refleja cómo se usan los datos en procesos diarios, como ventas, compras o finanzas. En lugar de acceder a tablas sin procesar, las vistas de CDS y los extractores exponen datos de una manera que se alinea con el significado empresarial. Por ejemplo, mostrando solo pedidos activos o incluyendo descripciones pertinentes y campos calculados.

InfoObjects/InfoProviders del almacén de negocios

InfoObjects e InfoProviders forman parte de la capa semántica de SAP Business Warehouse (BW). Forman el modelo multidimensional basado en hechos y dimensiones que se van a usar en el modelado e informes en todas las capas de la arquitectura BW. A medida que los datos se mueven a través de las capas, se transforman, limpian y enriquecen continuamente. Como resultado, los datos del mart de datos finales son coherentes y están preparados para su uso en informes e paneles empresariales.

Consultas BW

Las consultas son la interfaz principal para consumir datos almacenados en SAP BW. Definen métricas listas para la empresa, como los ingresos clave, los costos o las medidas de cantidad mediante la aplicación de cálculos, filtros y agregaciones sobre InfoProviders. Las consultas también están estrechamente integradas con el modelo de autorización de SAP y están optimizados para el rendimiento.

Elección del origen de datos correcto

La selección del origen de datos correcto depende del objetivo final y de la cantidad de transformación existente que desea reutilizar. Como se explicó en la sección anterior, los sistemas SAP ofrecen varias capas de acceso a datos, cada una adecuada para distintas fases del recorrido de datos, desde transacciones sin procesar hasta métricas empresariales totalmente modeladas. Los datos transaccionales se almacenan en una forma altamente normalizada, lo que significa que la información se divide en muchas tablas más pequeñas y relacionadas para reducir la redundancia y mejorar la eficacia. Estas tablas reflejan la salida sin procesar de los procesos empresariales, exactamente como se genera en el sistema. Este diseño promueve la integridad de los datos, pero hace que los informes y el análisis son más complejos.

Al pasar de tablas base hacia capas superiores, cada paso agrega más estructura, coherencia y alineación con el significado empresarial. Las vistas de CDS y los extractores BW dan forma a los datos transaccionales en formato multidimensional aplicando combinaciones básicas, filtros y lógica empresarial para simplificar el análisis y los informes. Estos objetos pueden presentar perspectivas diferentes en los mismos datos subyacentes, en función de la necesidad de informes. Por ejemplo, una vista puede centrarse en pedidos de ventas abiertos mientras que otros resaltan los elementos entregados. Esta flexibilidad permite que el mismo conjunto de datos admita varios escenarios analíticos sin duplicar los datos sin procesar.

A lo largo del recorrido de los datos, los objetos BW se encargan de almacenar, estructurar y preparar datos para informes empresariales. InfoObjects e InfoProviders forman juntos una base estandarizada para el análisis entre departamentos y herramientas. En la parte superior, las consultas exponen conjuntos de datos mantenidos, que se completan con filtros, cálculos y cifras clave predefinidos, listos para ser consumidos por paneles y plataformas de análisis externos.

Como recomendación general, cuanto mayor sea el nivel al que accede en la pila de datos, más contenido y lógica de negocios podrá reutilizar. En lugar de unir manualmente tablas base para crear una vista consolidada de los pedidos de ventas, puede aplicar objetos dedicados entregados por SAP, que ya incluyen combinaciones, filtros y asignaciones de campos pertinentes. Este enfoque reduce significativamente el esfuerzo de desarrollo y garantiza la coherencia con la forma en que se usan los datos dentro del sistema. Sin embargo, también significa aceptar las transformaciones integradas, como filtrar determinados estados de documento. Si se necesitan otros campos, los cambios se deben realizar en el nivel de origen, por ejemplo, ampliando la vista cds.

En la tabla siguiente se proporcionan ejemplos de escenarios comunes y se recomienda el origen de datos de SAP más adecuado en cada caso. El uso de un objeto específico es una decisión de diseño y siempre debe evaluarse en función de las opciones disponibles, los requisitos de datos y las funcionalidades del sistema.

Escenario/intención Origen de datos recomendado
Quiero acceder a tablas transaccionales sin procesar y aplicar transformaciones personalizadas y lógica de negocios. Tablas de SAP
No tengo conocimiento detallado del modelo de datos subyacente de SAP y quiero reutilizar la estructura y las relaciones existentes del sistema transaccional. Vistas de CDS/Extractores BW
Necesito crear paneles basados en datos transaccionales, pero preferimos trabajar con un modelo mantenido alineado con la empresa. Vistas de CDS/Extractores BW
Mi organización ya tiene un sistema BW con modelos de datos validados y quiero usarlos como base para los informes. BW InfoObjects/InfoProviders
Necesito una capa de informes segura con restricciones predefinidas y cifras clave específicas de la empresa, listas para su consumo en las herramientas de BI. Consultas BW

Resumen de las opciones de conectividad

En la tabla siguiente se resumen las opciones de conectividad disponibles para los sistemas SAP.

Conector Orígenes Caso de uso Solución ETL
SAP BW (servidor de aplicaciones o servidor de mensajes) SAP BW, SAP BW/4HANA
SAP S/4HANA
Acceso a la capa analítica multidimensional Microsoft Fabric (Dataflow Gen2)
SAP HANA SAP HANA, SAP HANA Cloud
SAP Datasphere
SAP BW-on-HANA
SAP BW/4HANA
Acceso a la capa analítica multidimensional
Acceso a artefactos SQL (tablas, vistas)
Acceso a las vistas de cálculo de HANA expuestas por SAP BW-on-HANA o BW/4HANA
Microsoft Fabric (Dataflow Gen2,
Tubería
Copiar trabajo)
Tabla sap (servidor de aplicaciones o servidor de mensajes) SAP S/4HANA
SAP ECC
Tablas de diccionario de datos de SAP (DDIC), vistas
Vistas de CDS de ABAP
Microsoft Fabric (canalización)
SAP CDC SAP S/4HANA
SAP ECC
Tablas de diccionario de datos de SAP (DDIC), vistas
Vistas de CDS de ABAP
Azure Data Factory (flujo de datos)
SAP BW OpenHub (servidor de aplicaciones o servidor de mensajes) SAP BW Acceso a datos en BW InfoProviders (ADSOs) Microsoft Fabric (canalización)
OData SAP SuccessFactors
SAP C4C
SAP S/4HANA
SAP ECC
Servicios de OData Microsoft Fabric (Dataflow Gen2,
Canalización)
ODBC SAP HANA, SAP HANA Cloud
SAP Datasphere
Acceso a artefactos SQL (tablas, vistas) Microsoft Fabric (Dataflow Gen2, Pipeline)
Creación de reflejo de la base de datos abierta SAP S/4HANA
SAP ECC
(basado en características de terceros)
Tablas de diccionario de datos de SAP (DDIC), vistas
Vistas de CDS de ABAP
Microsoft Fabric
Integración de salida Premium SAP S/4HANA
SAP ECC
SAP BW, SAP BW/4HANA (y otras soluciones según las opciones de conectividad de Datasphere)
Tablas de diccionario de datos de SAP (DDIC), vistas
Vistas de CDS de ABAP
SAP ODP
SAP Datasphere

Herramientas y soluciones de extracción de datos de SAP

En esta sección se proporciona información general sobre las herramientas y soluciones disponibles que se deben tener en cuenta al extraer datos de SAP en Microsoft Fabric.

Extracción de datos de SAP mediante Microsoft Fabric

Puede usar canalizaciones y flujos de datos en Microsoft Fabric para extraer y transformar datos de varios orígenes de datos de SAP.

Figura 1: Opciones de conectividad de datos de SAP en Microsoft Fabric.

En el diagrama se muestran las opciones de conectividad de datos de SAP en Microsoft Fabric.

Conector de tabla de SAP

El conector sap Table se conecta a sistemas SAP basados en ABAP y permite la extracción de instantáneas de datos de tabla. Admite el filtrado de datos mediante una sintaxis simple similar a ABAP. Para volúmenes de datos más grandes, puede aplicar particiones integradas en función de columnas seleccionadas, como publicar marca de tiempo para dividir la tabla en fragmentos más pequeños. El conector está disponible a través de canalizaciones en Microsoft Fabric.

Conector de SAP HANA

El conector de SAP HANA le permite conectarse a la base de datos de SAP HANA. Admite dos capas de acceso: la capa analítica multidimensional basada en vistas de cálculo de HANA y la capa transaccional que proporciona acceso a los datos almacenados en tablas y vistas.

Al conectarse a través de Dataflow Gen2, diseñado para el modelado semántico y el análisis, el conector de SAP HANA normalmente accede a la capa multidimensional. Las vistas de cálculo funcionan de forma similar a las consultas de SAP BW y a menudo se usan acceso directo a datos mantenidos y KPI siguiendo la lógica integrada.

Por el contrario, cuando el conector se usa en una canalización de Microsoft Fabric, compilada para la ingesta de datos A gran escala y ETL, tiene como valor predeterminado acceder a tablas de base de datos y vistas SQL. Este enfoque funciona bien cuando se trabaja con grandes cantidades de datos gracias a otras funcionalidades de creación de particiones de datos que permiten dividir y procesar grandes conjuntos de datos en paralelo, lo que mejora el rendimiento y la escalabilidad.

ODBC genérico

La conectividad ODBC genérica permite la conectividad a una amplia gama de bases de datos, entre las que se incluyen, entre otras, SAP HANA. Proporciona acceso flexible a las tablas y vistas subyacentes que lo hacen adecuado para escenarios en los que se necesita acceso directo a datos transaccionales sin procesar. Cuando se usa con una base de datos de SAP HANA, el conector ODBC genérico se conecta a la capa transaccional, lo que permite a los usuarios consultar datos de tablas base y vistas SQL.

Conector de SAP BW

El conector de SAP BW está diseñado para acceder a la capa analítica multidimensional en sistemas SAP. Se usa para ofrecer conjuntos de datos listos para la empresa y contiene medidas, jerarquías, filtros y autorizaciones predefinidos, lo que facilita la interpretación y el consumo de los datos en las herramientas de informes y análisis. El conector proporciona una manera confiable de extraer datos mantenidos y semánticamente enriquecidos, que se alinean estrechamente con los estándares de informes empresariales. El conector admite consultas BW desde SAP BW y BW/4HANA, y la capa analítica insertada en SAP S/4HANA, que puede usar para acceder a las vistas de SAP CDS.

SAP BW OpenHub

El conector openHub de SAP BW permite la extracción de datos de destinos de OpenHub en sistemas SAP BW. Los destinos de OpenHub se usan para exponer datos administrados por BW para el consumo externo. Cualquier objeto compatible con el proceso de transferencia de datos de SAP (DTP) puede servir como origen para OpenHub, incluidos datastore objects (DSO), InfoCubes y DataSources. Esto hace que sea una opción flexible para exportar datos estructurados y transformados.

El conector admite la extracción diferencial, que captura solo los registros que han cambiado desde la última carga correcta. El control delta se administra mediante el sistema SAP BW basado en la lógica definida en DTP, normalmente mediante marcas de tiempo, identificadores de solicitud o posiciones de registro de cambios. Una vez configurado, el sistema aplica automáticamente la lógica delta, lo que reduce la necesidad de realizar un seguimiento manual o una implementación personalizada.

Conector OData

Los servicios OData también pueden controlar la extracción de datos, que exponen datos empresariales de sistemas SAP a través de un protocolo estandarizado basado en REST. Este enfoque es adecuado para acceder a los datos disponibles a través de servicios de puerta de enlace de SAP, como los de SAP S/4HANA y SAP Business Suite. SAP proporciona un amplio conjunto de servicios OData preconfigurados que abarcan muchos procesos y objetos empresariales principales. Además, las vistas de CDS personalizadas o estándar se pueden exponer como puntos de conexión de OData, que ofrecen una manera flexible de recuperar datos semánticamente enriquecidos y bien estructurados.

Extracción de datos de SAP mediante Azure Data Factory

Azure Data Factory es un servicio de integración de datos basado en la nube que permite crear y programar canalizaciones para mover y transformar datos en diversos sistemas. Muchos conectores de datos, incluidos los específicos de SAP, como SAP Table y SAP BW, ya están disponibles en Microsoft Fabric. Si la integración de SAP es una nueva carga de trabajo que planea incorporar y está considerando Microsoft Fabric para el análisis, se recomienda encarecidamente usarla también para la integración de datos. De este modo, se beneficia de una experiencia más unificada en la ingesta, transformación y análisis de datos en una sola plataforma. Sin embargo, si ya tiene canalizaciones de SAP integradas en Azure Data Factory o necesita usar el conector CDC de SAP, no es necesario volver a usar el conector CDC de SAP. Las canalizaciones y flujos de datos existentes se pueden integrar con OneLake.

Figura 2: Opciones de conectividad de datos de SAP a Microsoft Fabric en Azure Data Factory.

En el diagrama se muestran las opciones de conectividad de datos de SAP a Microsoft Fabric en Azure Data Factory.

Conector CDC de SAP

El conector CDC de SAP permite la extracción incremental de datos de sistemas SAP mediante el marco de aprovisionamiento de datos operativos de SAP, disponible en entornos de ABAP. El marco de ODP realiza un seguimiento automático de las diferencias en el sistema de origen y los almacena en una cola delta. Cada vez que se ejecuta el conector, solo recupera los registros nuevos o modificados desde la última extracción, en función de una suscripción mantenida por el marco.

Admite una amplia gama de orígenes de datos de SAP, entre los que se incluyen:

  • Extractores BW
  • Vistas de Core Data Services (CDS)
  • Transformación horizontal de SAP (SLT)
  • BW InfoProviders
  • Vistas de información de SAP HANA

También admite el filtrado de datos y la creación de particiones para optimizar el rendimiento y controlar el volumen de datos durante la extracción.

Cuando el destino es un almacén de datos relacional, el conector CDC de SAP aplica automáticamente inserciones, actualizaciones y eliminaciones para mantener el destino sincronizado con el origen. Este proceso de combinación diferencial integrado garantiza que los sistemas de bajada siempre reflejen el estado más reciente de los datos de SAP sin necesidad de conciliación manual.

Nota:

Aunque Microsoft es totalmente compatible con el conector CDC de SAP como una solución confiable para la extracción de datos, antes de usar el conector CDC de SAP, consulte la nota de SAP pertinente: 3255746: uso no confirmado de las API de replicación de datos de ODP para determinar si es relevante para las licencias actuales de SAP.

Más información sobre el conector CDC de SAP en Azure Data Factory

Extracción de datos de SAP mediante SAP Datasphere

SAP Datasphere es la solución de nivel empresarial de SAP para extraer y transformar datos en sistemas heterogéneos. Admite conexiones a servicios de terceros y permite estrategias de movimiento de datos flexibles adaptadas a las necesidades empresariales.

Figura 3: Opciones de conectividad de datos de SAP a Microsoft Fabric en SAP Datasphere.

En el diagrama se muestran las opciones de conectividad de datos de SAP a Microsoft Fabric en SAP Datasphere.

Integración de salida Premium

Con la integración saliente Premium, los clientes pueden configurar flujos de replicación para extraer datos de sistemas de origen de SAP e ingerirlos en Azure Data Lake Gen2. El origen de datos podría ser un objeto dentro de SAP Datasphere, pero esta integración también permite extraer datos directamente desde el sistema de origen sin almacenarse en SAP Datasphere.

Una vez que los datos llegan a Azure Data Lake Gen2, se pueden exponer en los almacenes de lago de Microsoft Fabric mediante accesos directos. Estos accesos directos proporcionan acceso directo y de solo lectura a los datos ingeridos sin duplicar el almacenamiento, lo que permite flujos de trabajo eficaces de análisis y transformación directamente dentro de Fabric.

Conexión ODBC

La conectividad ODBC permite a los clientes consumir vistas en SAP Datasphere directamente desde cuadernos de Spark en Microsoft Fabric, lo que permite la exploración, transformación y análisis avanzado en tiempo real sin necesidad de replicación. El conector de SAP HANA también se puede usar para ingerir datos en microsoft Fabric lakehouses mediante canalizaciones y flujos de datos.

Soluciones para asociados

Un ecosistema creciente de asociados de confianza aporta experiencia especializada en la extracción de datos de entornos SAP complejos, como SAP S/4HANA y SAP BW/4HANA en Microsoft Fabric. Estos asociados van más allá de los conectores estándar mediante la entrega de complementos personalizados que abordan los requisitos específicos de la empresa.

Solución de partner Creación de reflejo de la base de datos abierta Integración de Lakehouse Certificación
LIMANDA Compatible Compatible Vínculo
ASAPIO Compatible Compatible Vínculo
Theobald Compatible Compatible Vínculo
Simplement Compatible Compatible Vínculo
Pegamento SNP Compatible Compatible Vínculo

Obtenga más información sobre las soluciones de asociados que admiten Open Mirroring.

Figura 4: Opciones de conectividad de datos de SAP a Microsoft Fabric mediante soluciones de asociados.

En el diagrama se muestran las opciones de conectividad de datos de SAP a Microsoft Fabric mediante soluciones de asociados.

Las soluciones de asociados suelen admitir dos patrones de integración:

Creación de reflejo de la base de datos abierta

Las soluciones de asociados aplican un conjunto de API nativas de Microsoft Fabric para sincronizar conjuntos de datos de origen con bases de datos reflejadas en Fabric. Este enfoque garantiza que las tablas de destino sigan siendo una copia coherente y up-to-date del origen, ya que el motor de creación de reflejo procesa y combina automáticamente los cambios.

Obtenga más información sobre Open Mirroring en Microsoft Fabric.

Lakehouse

La integración de Direct Lakehouse permite a los asociados ingerir datos en Fabric en modos completos e incrementales. Aunque este método ofrece flexibilidad y control, normalmente requiere otro procesamiento para controlar la desduplicación y consolidación de registros antes de que los datos estén listos para el análisis descendente.

Recursos

Centro de conocimiento de SAP: integración de datos

Información general y arquitectura de las funcionalidades CDC de SAP

Novedades de la conectividad de SAP en Microsoft Fabric: julio de 2025