Cómo funciona Azure Synapse Analytics

Completado

Para admitir las necesidades de análisis de las organizaciones actuales, Azure Synapse Analytics combina un servicio centralizado para el almacenamiento y el procesamiento de datos con una arquitectura extensible a través de la cual los servicios vinculados permiten integrar almacenes de datos, plataformas de procesamiento y herramientas de visualización usados habitualmente.

Creación y uso de un área de trabajo de Azure Synapse Analytics

Un área de trabajo de Synapse Analytics define una instancia del servicio Synapse Analytics en el que puede administrar los servicios y los recursos de datos necesarios para la solución de análisis. Puede crear un área de trabajo de Synapse Analytics en una suscripción de Azure de forma interactiva mediante Azure Portal o automatizar la implementación mediante Azure PowerShell, la interfaz de línea de comandos (CLI) de Azure o con una plantilla de Azure Resource Manager o Bicep.

Después de crear un área de trabajo de Synapse Analytics, puede administrar los servicios en él y realizar tareas de análisis de datos con ellos mediante Synapse Studio; un portal basado en web para Azure Synapse Analytics.

Captura de pantalla de Azure Synapse Studio.

Trabajo con archivos en un lago de datos

Uno de los recursos principales de un área de trabajo de Synapse Analytics es un lago de datos, en el que los archivos de datos se pueden almacenar y procesar a escala. Normalmente, un área de trabajo tiene un lago de datos predeterminado, que se implementa como servicio vinculado a un contenedor de Azure Data Lake Storage Gen2. Puede agregar servicios vinculados para varios lagos de datos basados en distintas plataformas de almacenamiento, según sea necesario.

Captura de pantalla de un servicio vinculado de Data Lake en Azure Studio.

Ingesta y transformación de datos con canalizaciones

En la mayoría de las soluciones de análisis de datos empresariales, los datos se extraen de varios orígenes operativos y se transfieren a un lago de datos central o almacenamiento de datos para el análisis. Azure Synapse Analytics incluye compatibilidad integrada para crear, ejecutar y administrar canalizaciones que orquestan las actividades necesarias para recuperar datos de una variedad de orígenes, transformar los datos según sea necesario y cargar los datos transformados resultantes en un almacén analítico.

Captura de pantalla de una canalización en Azure Synapse Studio.

Nota

Las canalizaciones de Azure Synapse Analytics se basan en la misma tecnología subyacente que Azure Data Factory. Si ya está familiarizado con Azure Data Factory, puede aprovechar las aptitudes existentes para crear soluciones de ingesta y transformación de datos en Azure Synapse Analytics.

Consulta y manipulación de datos con SQL

El lenguaje de consulta estructurado (SQL) es un lenguaje omnipresente para consultar y manipular datos, y es la base de las bases de datos relacionales, incluida la popular plataforma de base de datos Microsoft SQL Server. Azure Synapse Analytics admite la consulta y manipulación de datos basados en SQL a través de dos tipos de grupo de SQL basados en el motor de base de datos relacional de SQL Server:

  • Un grupo integrado sin servidor que está optimizado para usar la semántica de SQL relacional para consultar datos basados en archivos en un lago de datos.
  • Grupos de SQL dedicados personalizados que hospedan almacenes de datos relacionales.

El sistema Azure Synapse SQL usa un modelo de procesamiento de consultas distribuidas para paralelizar las operaciones SQL, lo que da lugar a una solución altamente escalable para el procesamiento de datos relacionales. Puede usar el grupo sin servidor integrado para el análisis y el procesamiento rentables de los datos de archivo en el lago de datos, y grupos de SQL dedicados, para crear almacenes de datos relacionales para el modelado y los informes de datos empresariales.

Captura de pantalla de una consulta SQL y bases de datos en Azure Synapse Studio.

Procesamiento y análisis de datos con Apache Spark

Apache Spark es una plataforma de código abierto para el análisis de macrodatos. Spark realiza el procesamiento distribuido de archivos en un lago de datos mediante la ejecución de trabajos que se pueden implementar con cualquiera de una variedad de lenguajes de programación admitidos. Entre los lenguajes admitidos en Spark se incluyen Python, Scala, Java, SQL y C#.

En Azure Synapse Analytics, puede crear uno o varios grupos de Spark y usar cuadernos interactivos para combinar código y notas a medida que crea soluciones para análisis de datos, aprendizaje automático y visualización de datos.

Captura de pantalla de un cuaderno de Spark en Azure Synapse Studio.

Exploración de datos con el explorador de datos

El explorador de datos de Azure Synapse es un motor de procesamiento de datos en Azure Synapse Analytics que se basa en el servicio Azure Data Explorer. El explorador de datos usa una sintaxis de consulta intuitiva denominada Lenguaje de consulta Kusto (KQL) para habilitar el análisis de alto rendimiento y baja latencia de los datos por lotes y de streaming.

Captura de pantalla de un script de lenguaje de consulta kusto en Azure Synapse Studio.

Integración con otros servicios de datos de Azure

Azure Synapse Analytics se puede integrar con otros servicios de datos de Azure para soluciones de análisis integrales. Entre las soluciones integradas se incluyen:

  • Azure Synapse Link permite la sincronización casi en tiempo real entre los datos operativos de Azure Cosmos DB, Azure SQL Database, SQL Server y Microsoft Power Platform Dataverse y el almacenamiento de datos analíticos que se pueden consultar en Azure Synapse Analytics.
  • La integración de Microsoft Power BI permite a los analistas de datos integrar un área de trabajo de Power BI en un área de trabajo de Synapse y realizar una visualización de datos interactiva en Azure Synapse Studio.
  • La integración de Microsoft Purview permite a las organizaciones catalogar recursos de datos en Azure Synapse Analytics y facilita a los ingenieros de datos encontrar recursos de datos y realizar un seguimiento del linaje de datos al implementar canalizaciones de datos que ingieren datos en Azure Synapse Analytics.
  • La integración de Azure Machine Learning permite a los analistas de datos y científicos de datos integrar el entrenamiento y el consumo predictivos del modelo en soluciones analíticas.