Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Data Factory en Microsoft Fabric es la próxima generación de Azure Data Factory, creada para controlar los desafíos de integración de datos más complejos con un enfoque más sencillo y eficaz.
Esta guía le ayuda a comprender las diferencias clave entre estos dos servicios, por lo que puede tomar la elección adecuada para su empresa. Le mostraremos las novedades, lo que es diferente y las ventajas que ofrece Fabric.
¿Está listo para explorar las opciones de migración? Consulte nuestra guía de migración.
Comparar características lado a lado
Aquí se muestra cómo se comparan las características principales entre Azure Data Factory y Fabric Data Factory. Hemos resaltado lo que ha cambiado, las novedades y lo que sigue siendo el mismo.
| Azure Data Factory | Data Factory en Fabric | Diferencias |
|---|---|---|
| Canalización | Canalización | Mejor integración: Las canalizaciones de Fabric funcionan sin problemas con Lakehouse, Data Warehouse y otros servicios de Fabric desde el principio. Las canalizaciones de tejido incluyen más actividades basadas en SaaS y difieren en las definiciones de JSON. Consulte nuestra comparación de características de canalización para obtener más detalles. |
| Asignación de Data Flow | Flujo de datos Gen2 | Más fácil de usar: Dataflow Gen2 proporciona una experiencia más sencilla para crear transformaciones. Estamos añadiendo más funciones de flujo de datos de mapeo a Gen2 constantemente. |
| Actividades | Actividades | Más actividades que vienen: Estamos trabajando para traer todas sus actividades favoritas de ADF a Fabric. Además, obtendrá novedades como la actividad Outlook de Office 365 que no está disponible en ADF. Consulte nuestra comparación de actividades para obtener más información. |
| Conjunto de datos | Solo conexiones | Enfoque más sencillo: no hay configuraciones de conjuntos de datos más complejas. En Data Factory de Fabric, utiliza conexiones para conectarte a tus orígenes de datos y comenzar a trabajar. Fabric elimina los conjuntos de datos, definiendo propiedades de datos en línea dentro de las actividades. |
| Servicios vinculados | Conexiones | Más intuitivo: las conexiones funcionan como servicios vinculados, pero son más fáciles de configurar y administrar. |
| Desencadenadores | Programar y archivar disparadores de eventos | Programación integrada: Use el scheduler de Fabric y los eventos Reflex para ejecutar automáticamente las canalizaciones. Los desencadenadores de eventos de archivo funcionan de forma nativa en Fabric sin configuración adicional. Fabric integra desencadenadores en su marco activator, a diferencia de los desencadenadores independientes de ADF. |
| Publicar | Guardar y ejecutar | Sin paso de publicación: en Fabric, omita el paso de publicación por completo. Simplemente seleccione Guardar para almacenar el trabajo o seleccione Ejecutar para guardar y ejecutar la canalización inmediatamente. |
| Autoresolve y Azure Integration Runtime | No es necesario | Arquitectura simplificada: no es necesario administrar entornos de ejecución de integración. Fabric gestiona la computación por usted. |
| Entornos de ejecución de integración autohospedados | Puerta de enlace de datos local | Mismo acceso local: conéctese a los datos locales mediante la conocida puerta de enlace de datos local. Obtenga más información en nuestra guía de acceso a datos local. |
| Entornos de ejecución de integración de SSIS de Azure | Por determinar | Funcionalidad futura en Fabric: todavía estamos trabajando en el diseño de la integración de SSIS en Fabric. |
| Redes virtuales administradas y puntos de conexión privados | por determinar. | Funcionalidad futura en Fabric: todavía estamos trabajando en la integración de redes virtuales administradas y puntos de conexión privados en Fabric. |
| Lenguaje de expresiones | Lenguaje de expresiones | Mismas expresiones: Tu conocimiento existente de expresiones se transfiere directamente. La sintaxis es casi idéntica. |
| Tipos de autenticación | Tipos de autenticación | Más opciones: todos los métodos de autenticación populares de ADF funcionan en Fabric, además de que hemos agregado nuevos tipos de autenticación. |
| CI/CD | CI/CD | Las funcionalidades mejoradas más allá de ADF incluyen una selección sencilla, promoción de elementos individuales, habilitación del repositorio de Git y opciones integradas de CI/CD de SaaS. |
| Exportación e importación de plantillas de ARM | Guardar como | Duplicación rápida: en Fabric, use "Guardar como" para duplicar rápidamente las canalizaciones para desarrollo o pruebas. |
| Supervisión | Centro de supervisión y historial de ejecución | Supervisión avanzada: el centro de supervisión ofrece una experiencia moderna con información entre áreas de trabajo y mejores funcionalidades de exploración en profundidad. |
| Depuración | Modo interactivo | Depuración simplificada: Fabric elimina el modo de depuración de ADF. Siempre estás en modo interactivo. |
| Captura de Cambios de Datos (CDC) | Tareas de copia | Movimiento de datos incremental: Fabric gestiona el movimiento incremental de datos mediante trabajos de duplicación en lugar de artefactos CDC. |
| Azure Synapse Link | Creación de reflejo | Replicación de datos: Fabric reemplaza Azure Synapse Link por características de creación de reflejo para la replicación de datos. |
| Ejecución de la actividad de canalización | Actividad de invocación de la canalización | Invocación multiplataforma: Fabric mejora la actividad ejecutar pipeline de ADF con invocación multiplataforma. |
Comparación de características de canalización
| Categoría | Canalizaciones de ADF | Canalizaciones de Fabric |
|---|---|---|
| Tipo de servicio | Servicio PaaS de integración de datos | Servicio SaaS de integración de datos |
| Entorno de creación | Azure portal (ADF Studio) | Área de trabajo de Fabric/PBI (interfaz de usuario unificada con Lakehouses, almacenes de datos, etc.) |
| Orquestación de tuberías | Flujos de trabajo completos con actividades, desencadenadores, y parámetros | Mismo modelo de orquestación, reimaginado para Fabric UX |
| Movimiento de datos | Actividad de copia, flujos de datos de asignación, compatibilidad con IR local, red virtual administrada | Actividad de copia, Flujos de datos Gen2, conectividad integrada con elementos OneLake y Fabric, Puerta de enlace de datos local, puerta de enlace de red virtual |
| Proceso/IR | Autohospedado, SSIS e Azure IR (para movimiento y transformación) | Conexiones en la nube, local y puerta de enlace de red virtual |
| Flujos de datos | Azure Blob, Data Lake Storage, SQL, más de 100 conectores | Mismos conectores y integración nativa de OneLake, alineación más estrecha del área de trabajo de Fabric |
| Supervisión | Canalizaciones y flujos de datos en ADF Studio con ejecuciones, desencadenadores, alertas | Supervisión del centro de supervisión y del área de trabajo con vistas unificadas entre canalizaciones, flujos de datos, cuadernos, bases de datos, etc. |
| Desencadenadores | Programaciones, ventana fija, desencadenadores basados en eventos | Programaciones, desencadenadores de eventos, desencadenadores de ventana de tiempo fijo como programaciones a intervalos |
| CI/CD | Plantillas de ARM + Integración de repositorios de Azure DevOps o GitHub | Tuberías de despliegue integradas en Fabric; promoción a nivel de área de trabajo (el desarrollo → la prueba → la producción) e integración de repositorios externos |
| Security | Identidades administradas, integración de Key Vault, puntos de conexión privados | Mismo modelo de seguridad más RBAC del área de trabajo de Fabric; Integración de seguridad de OneLake |
| Pricing | Pago según uso de Azure (por ejecución de actividad, movimiento de datos y cómputo) | Basado en capacidad (SKU de Fabric F) sin cargos por actividades externas o de canalización, solo ejecuciones de actividad y movimiento de datos de canalización |
Comparación de actividad
Con Data Factory en Microsoft Fabric, seguimos manteniendo un alto grado de continuidad con Azure Data Factory. Aproximadamente 90% de actividades accesibles en ADF ya están disponibles en Data Factory en Fabric. Este es un desglose de las actividades y su disponibilidad en ADF y Data Factory en Fabric:
| Activity | ADF | Data Factory en Fabric |
|---|---|---|
| ADX/KQL | Y | Y |
| Anexar variable | Y | Y |
| Azure Batch | Y | Y |
| Azure Databricks | Actividad del cuaderno • Actividad jar • Actividad de Python • Actividad de trabajo | Actividad de Azure Databricks |
| Azure Machine Learning | Y | Y |
| Ejecución por lotes de Azure Machine Learning | Deprecated | N/A |
| Recurso de actualización de Azure Machine Learning | Deprecated | N/A |
| Copiar | Copia de datos | actividad de copia |
| Flujo de datos Gen2 | N/A | Y |
| Delete | Y | Y |
| Ejecución e invocación de canalización | Ejecución de la canalización | Invocación de canalización |
| Cuadernos de Fabric | N/A | Y |
| Suspenso | Y | Y |
| Filter | Y | Y |
| Para cada uno | Y | Y |
| Functions | Función de Azure | Actividad de función |
| Obtener metadatos | Y | Y |
| HDInsight | Actividad de Hive • Actividad de Pig • Actividad de MapReduce • Actividad de Spark • Actividad de streaming | Actividad de HDInsight |
| Condición If | Y | Y |
| Lookup | Y | Y |
| Flujo de datos de asignación | Y | Flujo de datos Gen2 |
| Office 365 Outlook | N/A | Y |
| Power Query (solo ADF: depuración de datos) | Deprecated | N/A |
| Script | Y | Y |
| Actualización del modelo semántico | N/A | Y |
| Establecer variable | Y | Y |
| Sproc | Y | Y |
| SSIS | Y | N/A |
| Procedimiento almacenado | Y | Y |
| Conmutador | Y | Y |
| Actividades de Synapse Notebook y SJD | Y | N/A |
| Equipos | N/A | Y |
| Until | Y | Y |
| Validation | Y | Obtener metadatos y condición if |
| Wait | Y | Y |
| La web | Y | Y |
| Webhook | Y | Y |
| Gestión y manipulación del flujo de datos | Y | Flujo de datos Gen2 |
Nuevas actividades en Fabric Data Factory
Además de mantener la continuidad de la actividad, Data Factory en Fabric presenta algunas nuevas actividades para satisfacer sus necesidades de orquestación más enriquecidas. Estas nuevas actividades son:
- Outlook: disponible en Fabric Data Factory para facilitar la integración con los servicios de Outlook.
- Teams: disponible en Fabric Data Factory para habilitar la orquestación de actividades de Microsoft Teams.
- Actualización del modelo semántico: disponible en Fabric Data Factory para mejorar las funcionalidades de actualización del modelo semántico de Power BI.
- Dataflow Gen2: disponible en Fabric Data Factory para habilitar la orquestación de datos con funcionalidades avanzadas de flujo de datos.
Para obtener una lista de todas las actividades disponibles de Fabric Data Factory, consulte Información general sobre la actividad.
Comparación de conectores
Para obtener una comparación de todos los conectores y su disponibilidad en Azure Data Factory y Fabric Data Factory, consulte el artículo Comparación de conectores.
Integration Runtime autohospedado (SHIR) frente a Puerta de Enlace de Datos Local (OPDG)
Nota:
Los servicios compatibles con SHIR y ODPG son diferentes:
- Integration Runtime autohospedado (SHIR): admite Azure Data Factory, Azure Synapse Analytics, Azure Machine Learning Studio y Azure Purview.
- Puerta de enlace de datos local (OPDG): admite Power BI, Power Apps, Power Automate, Azure Analysis Services, Logic Apps, Fabric Dataflow Gen2, Fabric Pipeline, Fabric Copy Job y Fabric Mirroring.
| Categoría | Integration Runtime autogestionado (SHIR) | Puerta de enlace de datos local (OPDG) |
|---|---|---|
| Servicios compatibles | - Azure Data Factory - Azure Machine Learning Studio - análisis de Azure Synapse - Azure Purview |
- Power BI - Power Apps - Power Automate - Azure Analysis Services - Logic Apps - Flujo de datos de tejido Gen2 - Canalización de tejido - Trabajo de copia de tejido - Creación de reflejo del tejido |
| Instalación y registro | - Registrado por clave - Se ejecuta en modo de servicio |
- Registrado con la cuenta de Microsoft Entra ID - Admite el modo de usuario. |
| Plataforma | -Windows - Imagen de contenedor compatible |
- Solo Windows - No hay compatibilidad con contenedores |
| Compatibilidad con proxy | Admite tanto el proxy del sistema como el proxy personalizado. | - Compatibilidad con proxy personalizado |
| Vinculación de Región | - Asignado a la región de Data Factory. - No se puede cambiar la región predeterminada |
- Se puede cambiar la región |
| Retransmisión personalizada | - No compatible | - Soportado. Los clientes pueden traer su propio relé. |
| Uso compartido entre servicios | - Compartido con hasta 120 factorías de datos - No se puede compartir entre áreas de trabajo de ADF, Synapse, Purview o Synapse. |
- Disponible para todos los servicios admitidos dentro de una entidad |
| Alta disponibilidad | - Hasta 8 nodos (4 valores predeterminados) | - Hasta 10 nodos |
| Recuperación | - Requiere reinstalación | - Clave de recuperación admitida |
| Equilibrio de carga | - Equilibrio de carga a nivel de tarea basado en el número de trabajadores disponibles (CPU y memoria) | - Equilibrio de carga de nivel de consulta - Opciones de distribución round robin o aleatorias |
| Almacén de credenciales | - Almacenado localmente en nodos SHIR - Compatibilidad con Azure Key Vault |
- Almacenado centralmente en el servicio en la nube de Gateway - Ninguna integración de Key Vault |
| Actualización automática | -Soportado | - No compatible |
| Extensibilidad del conector | - No compatible | -Soportado |
| Creación interactiva | -Soportado | -Soportado |
| Private Link para el flujo de control | -Soportado | - No compatible |
| Control de versiones | - Dos versiones al mes; una insertada como actualización automática - Admite las versiones de los últimos 12 meses. |
- Una versión al mes - Admite las últimas 6 versiones |
| Limitación de CPU y memoria | - No compatible | -Soportado |
| Límites de rendimiento | - Sin límite máximo; dependiente del ancho de banda de red | Límites específicos del servicio: Power Apps/Power Automate/Logic Apps: - Escribir: límite de carga útil de 2 MB - Lectura: límite de solicitudes de 2 MB, límite de respuesta comprimida de 8 MB - Límite de direcciones URL de solicitud GET: 2048 caracteres Power BI Direct Query: límite de respuesta sin comprimir de 16 MB |
Puerta de enlace de datos de Red Virtual Administrada de ADF frente a Puerta de enlace de datos de Red Virtual de Infraestructura
La puerta de enlace de datos administrada de Azure Data Factory (ADF) y Microsoft Fabric Virtual Network (red virtual) le ayudan a conectarse a orígenes de datos de forma segura, sin exponerlos a la red pública de Internet. Aunque ambas opciones admiten la conectividad privada para cargas de trabajo en la nube, difieren en cómo se configuran, quién las administra y qué servicios admiten.
Red virtual administrada de ADF
Microsoft posee y administra el entorno de red. Obtiene una configuración sencilla, pero no puede controlar la configuración de red ni las reglas de firewall.Gateway de datos de VNET de Fabric
Despliegue el gateway dentro de su propia red virtual de Azure. Esto le proporciona control total sobre las redes, el firewall y el escalado. Decide cómo la puerta de enlace se conecta a los recursos y administra toda la configuración de red.
Use la tabla siguiente para comparar las principales diferencias y elegir la opción que se adapte a las necesidades de gobernanza y carga de trabajo.
| Categoría | Red virtual administrada de ADF | Puerta de enlace de datos de la arquitectura de red virtual |
|---|---|---|
| Servicios compatibles | Canalizaciones (pipelines) de Azure Data Factory y Synapse. | Flujos de datos de Microsoft Fabric Gen2, canalizaciones de datos de Fabric, trabajo de copia de Fabric, reflejo de Fabric, modelos semánticos de Power BI e informes paginados de Power BI |
| Propiedad de VNET | Red virtual administrada por Microsoft (el cliente no controla la red). | Red virtual administrada por el cliente (el cliente tiene control total). |
| Puntos de conexión privados | Autocreado y administrado por ADF para los servicios admitidos (Azure Storage, SQL DB, etc.). | Los clientes configuran la puerta de enlace de red virtual para conectar las cargas de trabajo de Fabric a los recursos dentro de su red virtual. |
| Control de redes | Limitado: los clientes solo pueden autorizar la integración del entorno de ejecución de red virtual en puntos de conexión privados. | Control total: el cliente configura el firewall, las reglas de NSG y el enrutamiento en su propia red virtual. |
| Instalación o implementación | Sin necesidad de instalación; totalmente administrado por Microsoft dentro de una red virtual oculta. | Requiere la implementación de la puerta de enlace de datos de red virtual en la red virtual del cliente. |
| Alta disponibilidad | Administrado por Microsoft, escalado automático dentro de la red virtual de ADF. Cambie al modo de reserva al habilitar TTL. | Admite el escalado y la alta disponibilidad (clústeres basados en nodos), pero se ejecuta dentro de la red virtual administrada por el cliente. Admite hasta 7 nodos. |
Características clave de Fabric Data Factory
En Data Factory de Fabric, la creación de tus canalizaciones, flujos de datos y otros elementos de Data Factory se facilita increíblemente gracias a la integración nativa con la revolucionaria función Co-Pilot de IA de Microsoft. Con Copilot para Data Factory, puede usar lenguaje natural para definir fácilmente los proyectos de integración de datos.
Integración de Native Lakehouse y Data Warehouse
Una de las mayores ventajas de Fabric Data Factory es cómo se conecta con las plataformas de datos. Lakehouse y Data Warehouse funcionan como orígenes y destinos en las canalizaciones, lo que facilita la creación de proyectos de datos integrados.
Notificaciones de correo electrónico inteligente con Office 365
¿Necesita mantener al equipo informado? La actividad de Office 365 Outlook le permite enviar notificaciones por correo electrónico personalizadas sobre ejecuciones de canalización, estado de actividad y resultados, todo ello con una configuración sencilla. Ya no se comprueban los paneles constantemente ni se escribe código de notificación personalizado.
Experiencia de conexión de datos simplificada
La experiencia moderna de Obtención de datos de Fabric hace que sea rápido configurar canalizaciones de copia y crear nuevas conexiones. Dedicará menos tiempo configurando y más tiempo haciendo llegar sus datos a donde se necesiten.
Mejoras de facilidad de uso en la experiencia de CI/CD
En Fabric, la experiencia de CI/CD es mucho más fácil y flexible que en Azure Data Factory o Synapse. No hay ninguna conexión entre las plantillas de CI/CD y ARM en Fabric, lo que hace que sea muy fácil elegir partes individuales del área de trabajo de Fabric para el registro, el registro de entrada, la validación y la colaboración. En ADF y Synapse, la única opción para CI/CD es usar su propio repositorio de Git. Sin embargo, en Fabric, puede optar por usar las canalizaciones de implementación integradas, las cuales no requieren traer su propio repositorio de Git externo.
Supervisión e información de nivel siguiente
La experiencia de supervisión en Fabric Data Factory es donde realmente verá la diferencia. El centro de supervisión proporciona una vista completa de todas las cargas de trabajo y puede explorar en profundidad cualquier actividad para obtener información detallada. El análisis entre áreas de trabajo está integrado directamente, por lo que puede ver la imagen general en toda la organización.
Al solucionar problemas de las actividades de copia, le encantará la vista de desglose detallada. Seleccione el botón de detalles de ejecución (el icono de gafas) para ver exactamente lo que ha ocurrido. El desglose de duración muestra cuánto tiempo ha tardado cada fase, lo que facilita la optimización del rendimiento.
Duplicación rápida de canalizaciones
¿Necesita crear una canalización similar? La característica Guardar como le permite duplicar cualquier canalización existente en segundos. Es perfecto para crear versiones de desarrollo, probar variaciones o configurar flujos de trabajo similares.
Contenido relacionado
Para obtener más información, consulte los siguientes recursos: