Comprendre les fonctionnalités du pool SQL serverless Azure Synapse et les cas d’usage

Effectué

Azure Synapse Analytics est un service d’analytique intégré qui regroupe un large éventail de technologies couramment utilisées pour le traitement et l’analyse des données à grande échelle. L’une des technologies les plus courantes utilisées dans les solutions de données est SQL : langage standard pour l’interrogation et la manipulation de données.

Pools SQL sans serveur dans Azure Synapse Analytics

Azure Synapse SQL est un système de requête distribué dans Azure Synapse Analytics qui offre deux types d’environnements d’exécution :

  • Pool SQL sans serveur : analyse des requêtes SQL à la demande, principalement utilisée pour travailler avec des données dans un lac de données.
  • pool SQL dédié: instances de base de données relationnelle à l’échelle de l’entreprise utilisées pour héberger des entrepôts de données dans lesquels les données sont stockées dans des tables relationnelles.

Dans ce module, nous allons nous concentrer sur le pool SQL serverless, qui fournit un point de terminaison de paiement à la requête pour interroger les données de votre lac de données. Les avantages de l’utilisation du pool SQL serverless sont les suivants :

  • Une syntaxe Transact-SQL familière pour interroger les données en place sans avoir à copier ou à charger des données dans un magasin spécialisé.
  • Une connectivité intégrée issue d’un large éventail d’outils décisionnels et d’outils de requête ad hoc, y compris les pilotes les plus populaires.
  • Traitement des requêtes distribués conçu pour les données à grande échelle et les fonctions de calcul, ce qui entraîne des performances de requête rapides.
  • Tolérance d’erreur d’exécution de requête intégrée, ce qui entraîne une fiabilité et des taux de réussite élevés, même pour les requêtes de longue durée impliquant des jeux de données volumineux.
  • Aucune infrastructure à configurer, ni de clusters à gérer. Un point de terminaison intégré pour ce service est fourni dans chaque espace de travail Azure Synapse. Vous pouvez donc commencer à interroger des données dès que l’espace de travail est créé.
  • Aucun frais pour les ressources réservées, vous êtes facturé uniquement pour les données traitées par les requêtes que vous exécutez.

Quand utiliser les services SQL sans serveur

Le pool SQL serverless est conçu pour interroger les données situées dans le lac de données. En plus d’éliminer la charge de gestion, il élimine le besoin de s'inquiéter de l’ingestion des données dans le système. Il vous suffit de pointer la requête vers les données déjà présentes dans le lac et de l'exécuter.

Le modèle de ressource Synapse SQL sans serveur est idéal pour les charges de travail non planifiées ou "éclatées" qui peuvent être traitées à l'aide du point de terminaison SQL sans serveur toujours actif dans votre espace de travail Azure Synapse Analytics. L'utilisation du pool serverless vous aide à connaître le coût exact de chaque requête exécutée pour surveiller et attribuer les coûts.

Remarque

Le pool SQL serverless est un système d’analytique et n’est pas recommandé pour les charges de travail OLTP, telles que les bases de données utilisées par les applications pour stocker des données transactionnelles. Les charges de travail qui nécessitent des temps de réponse en millisecondes et qui cherchent à identifier une seule ligne dans un jeu de données ne sont pas adaptées au pool SQL serverless.

Les cas d’usage courants pour les pools SQL serverless sont les suivants :

  • d’exploration des données : l’exploration des données implique de parcourir le lac de données pour obtenir des insights initiaux sur les données et est facilement réalisable avec Azure Synapse Studio. Vous pouvez parcourir les fichiers de votre stockage data lake lié et utiliser le pool SQL serverless intégré pour générer automatiquement un script SQL pour sélectionner les 100 premières lignes d’un fichier ou d’un dossier comme vous le feriez avec une table dans SQL Server. À partir de là, vous pouvez appliquer des projections, un filtrage, un regroupement et la plupart de l’opération sur les données comme si les données se trouvaient dans une table SQL Server standard.
  • transformation de données: bien qu’Azure Synapse Analytics offre de grandes fonctionnalités de transformations de données avec Synapse Spark, certains ingénieurs données peuvent trouver plus facilement la transformation des données à l’aide de SQL. Le pool SQL serverless vous permet d’effectuer des transformations de données basées sur SQL ; soit de manière interactive, soit dans le cadre d’un pipeline de données automatisé.
  • entrepôt de données logiques: après votre exploration initiale des données dans le lac de données, vous pouvez définir des objets externes tels que des tables et des vues dans une base de données SQL serverless. Les données restent stockées dans les fichiers data lake, mais sont abstraites par un schéma relationnel qui peut être utilisé par les applications clientes et les outils analytiques pour interroger les données comme elles le feraient dans une base de données relationnelle hébergée dans SQL Server.