Partager via


Préparer le choix d’un magasin de données dans Azure

Lorsque vous préparez votre environnement de zone d’atterrissage pour votre adoption du cloud, vous devez déterminer les exigences en matière de données pour l’hébergement de vos charges de travail. Les produits et services de base de données Azure prennent en charge différents scénarios et fonctionnalités de stockage de données. La façon dont vous configurez votre environnement de zone d’atterrissage pour prendre en charge vos besoins en données dépend de la gouvernance de votre charge de travail, de vos exigences techniques et métier.

Identifier les exigences des services de données

Dans le cadre de l’évaluation et de la préparation de votre zone d’atterrissage, vous devez identifier les magasins de données que votre zone d’atterrissage doit prendre en charge. Ce processus implique l’évaluation de chacune des applications et services qui composent vos charges de travail pour déterminer leurs besoins en matière de stockage et d’accès aux données. Après avoir identifié et documenté ces exigences, vous pouvez créer des stratégies pour votre zone d’atterrissage afin de contrôler les types de ressources autorisés en fonction des besoins de votre charge de travail.

Pour chaque application ou service que vous déployez dans votre environnement de zone d’atterrissage, utilisez les informations suivantes comme point de départ pour vous aider à déterminer les services de magasin de données appropriés à utiliser.

Spécifications fonctionnelles

Tenez compte de la nature de vos données et de la façon dont vous envisagez de l’utiliser :

  • Format des données : Structuré (tables), semi-structuré (JSON, XML et clé-valeur) ou non structuré (images et documents)

  • But: Traitement transactionnel en ligne (OLTP) pour les données transactionnelles ou le traitement analytique en ligne (OLAP) pour l’analyse complexe et ad hoc des données

  • Besoins de recherche : Fonctionnalité d’indexation ou fonctionnalité de recherche en texte intégral

  • Spécialisé: Stocks de vecteurs pour les données hautement dimensionnelles ou bases de données de graphes pour les données hautement interconnectées

  • Relations de données : Jointures, traversées de graphiques ou structures hiérarchiques

  • Modèle de cohérence : Cohérence forte, éventuelle ou configurable

  • Flexibilité du schéma : Schéma en écriture (rigide) et schéma en lecture (flexible)

  • Besoins en matière d’accès concurrentiel : Scénarios optimistes et pessimistes de verrouillage et d’écriture élevée

  • Cycle de vie des données : Archivage à court terme et données chaudes et froides

  • Déplacement des données : Exigences relatives à l’extraction, à la transformation et au chargement (ETL) ; exigences d’extraction, de chargement et de transformation (ELT) ; et l’intégration avec des pipelines

Exigences non fonctionnelles

Évaluez les attentes en matière de performances et d’extensibilité :

  • Latence et débit : Traitement en temps réel et traitement par lots
  • Scalabilité : Mise à l’échelle verticale et horizontale et distribution globale
  • Fiabilité et disponibilité : Exigences du contrat de niveau de service (SLA) et stratégies de basculement.
  • Limites: Contraintes de taille de stockage, de débit et de partitionnement

Considérations relatives aux coûts et à la gestion

Facteur de surcharge opérationnelle et de budget :

  • Géré versus auto-hébergé : Compromis entre plateforme en tant que service (PaaS) et infrastructure en tant que service (IaaS)
  • Disponibilité de la région : Besoins en matière de résidence et de conformité des données
  • Optimisation des coûts : Stockage hiérarchisé, partitionnement et mise en cache
  • Gestion des licences et portabilité : Enfermement propriétaire et compatibilité open source

Sécurité et gouvernance

Vérifiez l’alignement avec les stratégies d’organisation :

  • Chiffrement: Chiffrement au repos et en transit
  • Authentification et autorisation : Intégration des identités et des accès en fonction du rôle
  • Audit et surveillance : Journaux d’activité, alertes et diagnostics
  • Réseautage: Points de terminaison privés, règles de pare-feu et intégration de réseau virtuel

Préparation à DevOps et à l’équipe

Évaluez la capacité de votre équipe à prendre en charge et à faire évoluer la solution :

  • Compétences: Connaissance des langages de requête, des kits sdk et des outils
  • Support client : Liaisons linguistiques et disponibilité des pilotes
  • Intégration des outils : Pipelines d’intégration continue et de livraison continue (CI/CD) et outils d’observabilité

Questions clés

Répondez aux questions suivantes sur vos charges de travail pour prendre des décisions en fonction de l’arbre de décision des services de base de données Azure :

  • Quel niveau de contrôle avez-vous besoin sur le système d’exploitation et le moteur de base de données ? Certains scénarios vous obligent à avoir un niveau élevé de contrôle ou de propriété des serveurs de configuration logicielle et d’hôte pour vos charges de travail de base de données. Dans ces scénarios, vous pouvez déployer des machines virtuelles IaaS personnalisées pour contrôler entièrement le déploiement et la configuration des services de données. Vous n’avez peut-être pas besoin de ce niveau de contrôle, mais vous n’êtes peut-être pas prêt à passer à une solution PaaS complète. Dans ce cas, une instance managée peut fournir une compatibilité plus élevée avec votre moteur de base de données local tout en offrant les avantages d’une plateforme managée.

  • Vos charges de travail utiliseront-ils une technologie de base de données relationnelle ? Si c’est le cas, choisissez parmi Azure SQL Database, Azure Database pour MySQL et Azure Database pour PostgreSQL, qui fournissent toutes des fonctionnalités de base de données PaaS managées.

  • Vos charges de travail utiliseront-ils SQL Server ? Dans Azure, vos charges de travail peuvent s’exécuter sur sql Server basé sur IaaS sur des machines virtuelles Azure ou sur le service hébergé sql Database basé sur PaaS. Votre choix varie selon que vous souhaitez gérer votre base de données, appliquer des correctifs et effectuer des sauvegardes ou déléguer ces opérations à Azure. Certains scénarios nécessitent un serveur SQL Server hébergé par IaaS en raison des exigences en matière de fonctionnalités. Pour plus d’informations, consultez Choisir l’option SQL Server appropriée dans Azure.

  • Vos charges de travail utiliseront-ils le stockage de base de données clé-valeur ?Azure Managed Redis est un magasin de données en mémoire géré basé sur la dernière version de Redis Enterprise. Il offre une faible latence et un débit élevé. Azure Cosmos DB fournit également des fonctionnalités de stockage clé-valeur.

  • Vos charges de travail utiliseront-elles des données de document ou de graphique ?Azure Cosmos DB est un service de base de données multimodel qui prend en charge différents types de données et API. Il fournit également des fonctionnalités de base de données de documents et de graphiques. Azure DocumentDB est un service de base de données entièrement managé, open source et compatible MongoDB.

  • Vos charges de travail utiliseront-elles des données de famille de colonnes ?Azure Managed Instance pour Apache Cassandra fournit un cluster Apache Cassandra managé qui peut étendre vos centres de données existants dans Azure ou servir de cluster et de centre de données cloud uniquement.

  • Vos charges de travail nécessitent-elles des fonctionnalités d’analytique des données à haute capacité ?Microsoft Fabric est une plateforme d’analytique de bout en bout prête pour l’entreprise. Il unifie le déplacement des données, le traitement des données, l’ingestion, la transformation, le routage des événements en temps réel et la génération de rapports.

  • Vos charges de travail nécessitent-elles des fonctionnalités de moteur de recherche ? Vous pouvez utiliser Azure AI Search pour créer des index de recherche cloud améliorés par l’IA qui peuvent s’intégrer à vos applications.

  • Vos charges de travail utiliseront-elles des données de série chronologique ?Azure Data Explorer est une plateforme d’analytique Big Data managée et hautes performances qui analyse des volumes élevés de données en quasi-temps réel.

Note

Pour plus d’informations sur l’évaluation des options de base de données pour chacune de vos applications ou services, consultez Comprendre les modèles de magasin de données.

Scénarios de base de données courants

Le tableau suivant répertorie les exigences de scénario d’utilisation courante et les services de base de données recommandés pour les gérer.

Votre objectif Service de base de données recommandé
Créez des applications évolutives avec une base de données SQL gérée et intelligente dans le cloud. Base de données SQL
Moderniser des applications SQL Server à l’aide d’une instance SQL gérée up-to-date dans le cloud. Azure SQL Managed Instance
Migrez vos charges de travail SQL vers Azure tout en conservant l’accès complet au niveau du système d’exploitation et de compatibilité SQL Server. SQL Server sur les machines virtuelles
Créez des applications évolutives et managées prêtes pour l’entreprise sur PostgreSQL open source, effectuez un scale-out de PostgreSQL à nœud unique avec des performances élevées ou migrez des charges de travail PostgreSQL et Oracle vers le cloud. Base de données Azure pour PostgreSQL
Fournissez une haute disponibilité et une mise à l’échelle élastique aux applications mobiles et web open source à l’aide d’un service de base de données MySQL communautaire géré ou migrez des charges de travail MySQL vers le cloud. Base de données Azure pour MySQL
Créez des applications qui ont garanti une faible latence et une haute disponibilité n’importe où, à n’importe quelle échelle, ou migrez Cassandra, Gremlin et d’autres charges de travail NoSQL vers le cloud. Azure Cosmos DB
Migrer des charges de travail MongoDB vers le cloud ou créer des applications hybrides et multiclouds avec une mise à l’échelle verticale et horizontale à haute capacité Azure DocumentDB
Moderniser les clusters et applications de données Cassandra existants et bénéficier d’une flexibilité à l’aide d’un service d’instance managée. Azure Managed Instance pour Apache Cassandra
Fournissez des applications rapides et évolutives à l’aide d’un magasin de données en mémoire compatible open source. Azure Redis géré

Comparaison des fonctionnalités de base de données

Le tableau suivant répertorie les fonctionnalités disponibles dans les services de base de données Azure.

Caractéristique SQL Database Instance managée SQL Base de données Azure pour PostgreSQL Azure Database pour MySQL Azure Managed Instance pour Apache Cassandra Base de données Azure Cosmos DB Azure Redis géré Azure DocumentDB
Type de base de données Relationnel Relationnel Relationnel Relationnel NoSQL NoSQL En mémoire NoSQL
Modèle de données Relationnel Relationnel Relationnel Relationnel Large colonne Multimodel : Document, large colonne, clé-valeur, graphique Clé-valeur Document
Écritures de données multiprimaires distribuées Non Non Non Non Oui Oui Oui Oui
Prise en charge de la connectivité des réseaux virtuels Point de terminaison de service de réseau virtuel Implémentation de réseau virtuel natif Injection de réseau virtuel (serveur flexible uniquement) Injection de réseau virtuel (serveur flexible uniquement) Implémentation de réseau virtuel natif Point de terminaison de service de réseau virtuel Point de terminaison de service de réseau virtuel Point de terminaison de service de réseau virtuel

Note

Le service Azure Private Link simplifie la conception réseau en permettant aux services Azure de communiquer via la mise en réseau privée. Tous les services de base de données Azure prennent en charge le service Azure Private Link. Pour les services de base de données d’instance managée, ces instances sont déployées dans des réseaux virtuels. Vous n’avez donc pas besoin de déployer des points de terminaison privés pour eux.

Disponibilité régionale

Azure vous aide à fournir des services à l’échelle nécessaire pour atteindre les clients et les partenaires n’importe où. Lorsque vous planifiez votre déploiement cloud, déterminez la région Azure pour héberger vos ressources de charge de travail.

La plupart des régions Azure prennent en charge la plupart des services de base de données. Quelques régions ne prennent en charge qu’un sous-ensemble de ces produits, mais elles ciblent principalement les clients gouvernementaux. Avant de décider quelles régions déployer vos ressources de base de données, consultez Produits disponibles par région pour vérifier l’état le plus récent de la disponibilité régionale.

Pour plus d’informations sur l’infrastructure mondiale Azure, consultez les zones géographiques Azure.

Exigences de résidence et de conformité des données

Les exigences légales et contractuelles relatives au stockage des données s’appliquent souvent aux charges de travail. Ces exigences peuvent varier en fonction de l’emplacement de votre organisation, de la compétence des ressources physiques qui hébergent vos magasins de données et de votre secteur d’activité applicable. Tenez compte des composants suivants des obligations de données :

  • Classification des données
  • Emplacement des données
  • Responsabilités en matière de protection des données dans le modèle de responsabilité partagée

Pour plus d’informations sur ces exigences, consultez Obtenir la résidence et la sécurité des données conformes avec Azure.

Une partie de vos efforts de conformité peut inclure le contrôle de l’emplacement physique de vos ressources de base de données. Les régions Azure sont organisées en groupes appelés zones géographiques. Une zone géographique Azure respecte la résidence des données, la souveraineté, la conformité et les exigences de résilience dans les limites géographiques et politiques. Si vos charges de travail sont soumises à la souveraineté des données ou à d’autres exigences de conformité, vous devez déployer vos ressources de stockage dans des régions dans une zone géographique Azure conforme.

Établir des contrôles pour les services de base de données

Lorsque vous préparez votre environnement de zone d’atterrissage, vous pouvez établir des contrôles qui limitent les magasins de données que les utilisateurs peuvent déployer. Les contrôles peuvent vous aider à gérer les coûts et à limiter les risques de sécurité. Les développeurs et les équipes informatiques peuvent toujours déployer et configurer des ressources qui prennent en charge vos charges de travail.

Après avoir identifié et documenté les exigences de votre zone d’atterrissage, vous pouvez utiliser Azure Policy pour contrôler les ressources de base de données que vous autorisez les utilisateurs à créer. Les contrôles peuvent autoriser ou refuser la création de types de ressources de base de données.

Par exemple, vous pouvez restreindre les utilisateurs à la création de ressources SQL Database uniquement. Utilisez des stratégies pour contrôler les options que les utilisateurs peuvent sélectionner lorsqu’ils créent des ressources. Par exemple, vous pouvez restreindre les références SKU SQL Database que les utilisateurs peuvent provisionner en autorisant uniquement l’installation de versions spécifiques de SQL Server sur une machine virtuelle IaaS. Pour plus d’informations, consultez les définitions de stratégie intégrées Azure Policy.

Vous pouvez appliquer des stratégies aux ressources, aux groupes de ressources, aux abonnements et aux groupes d’administration. Incluez vos stratégies dans les définitions Azure Blueprints et appliquez-les à plusieurs reprises dans votre patrimoine cloud.

Étapes suivantes

Utilisez les articles suivants pour choisir un magasin de données spécialisé :