Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describen las formas en que las pequeñas o medianas empresas pueden migrar y modernizar los almacenes de datos heredados dentro de sus presupuestos y conjuntos de aptitudes actuales. Muestra cómo explorar progresivamente las funcionalidades y las herramientas de macrodatos. Estas soluciones de almacenamiento de datos se integran con Azure Machine Learning, Foundry Tools, Microsoft Power Platform, Dynamics 365 y otras tecnologías de Microsoft. Estas soluciones proporcionan un punto de entrada inicial a Microsoft Fabric, que es una plataforma de datos de software como servicio (SaaS) administrada que puede expandirse a medida que crecen sus necesidades.
Este patrón admite pequeñas o medianas empresas que tienen las siguientes características:
Utilizar SQL Server local para soluciones de almacenamiento de datos de menos de 1 terabyte (TB)
Emplear herramientas tradicionales de SQL Server como SQL Server Integration Services (SSIS), SQL Server Analysis Services (SSAS), SQL Server Reporting Services (SSRS), procedimientos almacenados de SQL comunes y trabajos del Agente SQL Server
Usar herramientas externas de extracción, transformación y carga (ETL) y extracción, carga y transformación (ELT)
Confiar en la replicación de instantáneas para la sincronización de datos
Ejecutar operaciones basadas en lotes y no requerir informes en tiempo real
Arquitectura simplificada
Diagrama que muestra un flujo de datos para la modernización del almacenamiento de datos empresariales pequeños o medianos. A la izquierda, una solución de almacenamiento de datos heredados se conecta a través de una flecha de canalización de datos a un cuadro de puntos con la etiqueta Almacenar y procesar. Este cuadro contiene Azure SQL Database y Azure SQL Managed Instance y se conecta a un segundo cuadro punteado con la etiqueta Procesar y presentar. Esta caja incluye Fabric y se conecta a Power BI.
Descargue un archivo de Visio de esta arquitectura.
Una oportunidad de modernización conceptual implica la transición de una solución de almacenamiento de datos heredada a una combinación de Azure SQL Database, Azure SQL Managed Instance y Fabric. Esta estrategia garantiza una amplia compatibilidad con las herramientas tradicionales de SQL Server y SQL Client, como SQL Server Management Studio (SSMS). También proporciona opciones de reasignación de hospedaje para los procesos existentes y requiere una capacitación mínima para el equipo de soporte. Esta solución proporciona un paso inicial hacia una modernización completa. A medida que crece el almacenamiento de datos y su equipo obtiene experiencia, puede avanzar hasta el almacenamiento completo de SaaS en Fabric o adoptar un enfoque de lakehouse.
Los almacenes de datos heredados para pequeñas o medianas empresas pueden contener varios tipos de datos:
Datos no estructurados, como documentos y gráficos
Datos semiestructurados, como registros, valores separados por comas (CSV), ARCHIVOS JSON y XML
Datos relacionales estructurados, incluidas las bases de datos que usan procedimientos almacenados para actividades ETL y ELT
Arquitectura
Descargue un archivo de Visio de esta arquitectura.
Flujo de datos
El siguiente flujo de datos corresponde al diagrama anterior:
Las canalizaciones de datos de tejido o las canalizaciones de Azure Data Factory ingieren datos transaccionales en la solución de almacenamiento de datos.
Las canalizaciones orquestan el flujo de bases de datos heredadas que han sido migradas o parcialmente refactorizadas hacia SQL Database o Instancia Administrada de SQL. Este enfoque de rehospedaje proporciona una transición de una solución SQL local a un futuro entorno de SaaS de Fabric. Puede modernizar las bases de datos de forma incremental después de la migración inicial.
Las canalizaciones pueden mover datos no estructurados, semiestructurados y estructurados a Azure Data Lake Storage para el almacenamiento centralizado y el análisis entre orígenes. Use este enfoque al combinar datos de varios orígenes proporciona más valor empresarial que migrar los datos a una nueva plataforma.
Use datos de Dynamics 365 para crear paneles de inteligencia empresarial (BI) centralizados mediante herramientas de análisis sin servidor de Fabric en conjuntos de datos enriquecidos. Puede ingerir datos de Dynamics 365 en Data Lake Storage o vincular su entorno de Dataverse directamente a Fabric mediante un acceso directo de Dynamics 365 en OneLake. Puede volver a escribir los resultados de análisis en Dynamics 365 o continuar el análisis en Fabric.
Azure Event Hubs u otras soluciones de streaming transmiten datos en tiempo real al sistema. Inteligencia en Tiempo Real de Fabric proporciona análisis inmediatos para soportar paneles en tiempo real.
Los accesos directos de Data Lake Storage introducen los datos en Fabric OneLake para el análisis, el almacenamiento y los informes. Este enfoque analiza los datos en su lugar sin moverlos y hace que esté disponible para los consumidores de nivel inferior.
Fabric proporciona herramientas de análisis sin servidor a petición, como el punto de conexión de SQL Analytics y Apache Spark, sin necesidad de recursos aprovisionados. Estas herramientas admiten las actividades siguientes:
Actividades de ETL y ELT en datos de OneLake
Provisión de la capa dorada de la arquitectura de medallón a los informes de Power BI a través de la funcionalidad DirectLake
Exploraciones improvisadas de ciencia de datos en T-SQL o Python
Creación de prototipos tempranas para entidades de almacenamiento de datos
Fabric se integra con los consumidores de los conjuntos de datos de varios orígenes, incluidos los informes front-end de Power BI, Machine Learning, Power Apps, Azure Logic Apps, Azure Functions y las aplicaciones web de Azure App Service.
Componentes
Fabric es un servicio de análisis que combina la ingeniería de datos, el almacenamiento de datos, la ciencia de datos y las funcionalidades de inteligencia empresarial en tiempo real. En esta arquitectura, las funcionalidades de ingeniería de datos de Fabric proporcionan una plataforma colaborativa para ingenieros de datos, científicos de datos, analistas de datos y profesionales de BI. Fabric usa motores de proceso sin servidor para generar información que admita la toma de decisiones empresariales.
SQL Database e Instancia administrada de SQL son servicios de base de datos relacionales basados en la nube. En esta arquitectura, estos servicios hospedan el almacenamiento de datos empresariales y realizan actividades ETL y ELT mediante procedimientos almacenados o paquetes externos (SSIS). SQL Database y SQL Managed Instance son entornos de plataforma como servicio (PaaS) que puede usar para cumplir los requisitos de alta disponibilidad y recuperación ante desastres. Elija una SKU que cumpla sus requisitos. Para obtener más información, consulte Alta disponibilidad para SQL Database y Alta disponibilidad para SQL Managed Instance.
Event Hubs es una plataforma de streaming de datos en tiempo real y un servicio de ingesta de eventos. En esta arquitectura, Event Hubs se integra con los servicios de datos de Azure para ingerir datos de streaming de varios orígenes en Data Lake Storage para análisis e informes. Event Hubs también puede transmitir datos directamente a Real-Time Intelligence.
Data Lake Storage es un repositorio centralizado basado en la nube que almacena datos estructurados y no estructurados. En esta arquitectura, Data Lake Storage puede almacenar datos de streaming archivados y copias de datos de Dynamics 365.
Alternativas
Puede usar Azure IoT Hub para reemplazar o complementar Event Hubs. Elija su solución según el origen de los datos de streaming y de si necesita clonación y comunicación bidireccional con los dispositivos de informes.
Puede usar canalizaciones de datos de Fabric en lugar de canalizaciones de Data Factory para la integración de datos. La decisión depende de varios factores. Para más información, consulte Diferencias entre Azure Data Factory y Fabric Data Factory.
Puede usar Fabric Data Warehouse en lugar de SQL Database o SQL Managed Instance para almacenar datos empresariales. En este artículo se da prioridad al tiempo de comercialización (TTM) para los clientes que desean modernizar sus almacenes de datos. Para más información, consulte Opciones del almacén de datos de Fabric.
Detalles del escenario
Las pequeñas o medianas empresas que modernizan los almacenes de datos locales para la nube pueden elegir entre dos enfoques. Puede adoptar herramientas de macrodatos para una escalabilidad futura o usar soluciones tradicionales basadas en SQL para la eficiencia de los costos y una transición predecible. Un enfoque híbrido le permite migrar los datos existentes al usar las herramientas modernas y las funcionalidades de inteligencia artificial. Puede mantener los orígenes de datos basados en SQL ejecutándose en la nube y modernizarlos de forma incremental.
En este artículo se describe cómo las pequeñas o medianas empresas pueden modernizar los almacenes de datos heredados y adoptar herramientas de macrodatos mientras se mantienen dentro de los presupuestos y conjuntos de aptitudes existentes. Estas soluciones de almacenamiento de datos de Azure se integran con los servicios de Azure y Microsoft, incluidas Las herramientas de Foundry, Dynamics 365 y Power Platform.
Posibles casos de uso
Migre un almacenamiento de datos relacional local tradicional que tenga menos de 1 TB y use paquetes SSIS para organizar los procedimientos almacenados.
Combine datos de Dynamics 365 o Dataverse con datos por lotes y en tiempo real de Data Lake Storage.
Use técnicas innovadoras para interactuar con los datos centralizados de Data Lake Storage. Estas técnicas incluyen análisis sin servidor, minería de conocimiento, fusión de datos entre dominios y exploración de datos de autoservicio mediante Copilot en Fabric.
Permitir que las empresas de comercio electrónico adopten el almacenamiento de datos en la nube para la optimización operativa.
No se recomienda esta solución para los escenarios siguientes:
Implementaciones de almacenamiento de datos de Greenfield. Para este escenario, consulte Greenfield lakehouse on Fabric.
Almacenes de datos locales de 1 TB o mayores, o que alcancen ese tamaño en un año. La mayoría de las organizaciones adoptan soluciones de almacenamiento de datos especializadas para almacenes de datos de este tamaño. Para estos escenarios, consulte Alternativas de replatforming.
Consideraciones
Estas consideraciones implementan los pilares de Azure Well-Architected Framework, que es un conjunto de principios rectores que puede usar para mejorar la calidad de una carga de trabajo. Para obtener más información, consulte Well-Architected Framework.
Reliability
La confiabilidad ayuda a garantizar que la aplicación pueda cumplir los compromisos contraídos con los clientes. Para obtener más información, consulte Lista de comprobación de revisión de diseño para confiabilidad.
Usted y Microsoft comparten la responsabilidad de la confiabilidad de la mayoría de los servicios de Azure. Microsoft proporciona capacidades para apoyar la resiliencia y la recuperación. Debe comprender cómo funcionan esas funcionalidades en cada servicio que use y seleccione las configuraciones que cumplen los objetivos empresariales y los objetivos de tiempo de actividad. Revise la documentación específica del servicio para seleccionar configuraciones que cumplan los objetivos de continuidad empresarial y recuperación ante desastres.
Optimización de costos
La optimización de costos se centra en formas de reducir los gastos innecesarios y mejorar las eficiencias operativas. Para obtener más información, consulte Lista de comprobación de revisión de diseño para la optimización de costos.
La calculadora de precios de Azure le permite modificar valores para comprender cómo afectan los requisitos específicos a los costos. Consulte un ejemplo de precios para un escenario de almacenamiento de datos empresariales pequeños o medianos.
Los precios de SQL Database dependen del nivel de proceso, el nivel de servicio, el número de núcleos virtuales y las unidades de transacción de base de datos. En el ejemplo de precios se usa una base de datos única con proceso aprovisionado y ocho núcleos virtuales para ejecutar procedimientos almacenados en SQL Database. Puede reducir los costos mediante la capacidad reservada y las ventajas híbridas de Azure.
Los precios de Data Lake Storage dependen del volumen de almacenamiento y la frecuencia de acceso a los datos. El ejemplo de precios incluye 1 TB de almacenamiento de datos y costos de transacción asociados. Los 1 TB representan el tamaño del lago de datos, no el tamaño de la base de datos heredada original. Data Lake Storage es un costo adicional de modernización más allá de la base de datos heredada.
Los precios de Fabric dependen del modelo de capacidad de Fabric F o del modelo Premium por persona. Las funcionalidades sin servidor consumen CPU y memoria de la capacidad dedicada adquirida. Después de la modernización, los informes existentes siguen funcionando conectándose al nuevo almacén de datos (SQL Database o Instancia Administrada de SQL) con las licencias existentes. El ejemplo de precios incluye la SKU F2 para representar la expansión futura de BI mediante la preparación de datos de autoservicio, datamarts, Real-Time Intelligence y flujos de trabajo asistidos por IA. La SKU F2 con reserva de un año proporciona un punto de entrada rentable. Si actualmente usa Power BI Premium o migra a F64, es posible que no necesite capacidad F adicional.
Los precios de Event Hubs dependen del nivel seleccionado, de las unidades de rendimiento aprovisionadas (PTU) y del volumen de tráfico de entrada. En el ejemplo de precios se supone que una unidad de rendimiento del nivel Estándar controla más de un millón de eventos al mes. Event Hubs representa un costo de modernización adicional si agrega funcionalidades de streaming en tiempo real a la solución.
Colaboradores
Microsoft mantiene este artículo. Los colaboradores siguientes escribieron este artículo.
Autor principal:
- Galina Polyakova | Arquitecto sénior de soluciones en la nube
Otro colaborador:
- Bhaskar Sharma | Jefe de programas sénior
Para ver los perfiles no públicos de LinkedIn, inicie sesión en LinkedIn.
Pasos siguientes
- Rutas de aprendizaje del ingeniero de datos
- Introducción a Fabric
- Examinar todos los cursos, rutas de aprendizaje y módulos de Fabric
- Creación de una base de datos única
- Creación de una implementación de SQL Managed Instance
- Creación de una cuenta de almacenamiento que se usará con Data Lake Storage
- Creación de un centro de eventos mediante Azure Portal