Partager via


Configurer pour la haute disponibilité

Cette page explique comment configurer une instance de base de données Lakebase pour la haute disponibilité en activant des instances secondaires lisibles.

Important

Cette fonctionnalité est en préversion publique dans les régions suivantes : westus, , westus2eastuseastus2, , centralus, southcentralus, , northeuropewesteurope, , australiaeastbrazilsouth, , canadacentral, centralindia, , . southeastasiauksouth

Pour activer la haute disponibilité, spécifiez des nœuds supplémentaires dans le cadre d’une instance de base de données. Si le calcul principal devient défectueux ou indisponible, un nœud à haute disponibilité est utilisé pour effectuer un basculement et le nœud secondaire est promu en nœud principal.

Vous pouvez également activer des nœuds secondaires lisibles, permettant aux nœuds à haute disponibilité de servir des charges de travail en lecture seule à l’aide d’un point de terminaison DNS distinct (instance-ro-{uuid} comparé à instance-{uuid}).

Activer l’instance de base de données pour la haute disponibilité

Si vous définissez le nombre de nœuds à haute disponibilité sur un, les secondaires à haute disponibilité et accessibles en lecture sont désactivés. Sinon, vous disposez d’un nœud principal et le reste est des nœuds à haute disponibilité. Le nombre maximal de nœuds à haute disponibilité est de trois par instance de base de données.

Spécifiez le nombre de nœuds à haute disponibilité lors de la création de votre instance de base de données. Consultez Créer une instance de base de données.

Procédez comme suit pour modifier l’instance de base de données à l’aide de l’interface utilisateur ou de l’API.

IU

  1. Cliquez sur Calcul dans la barre latérale de l’espace de travail.
  2. Cliquez sur l’onglet Instances de base de données .
  3. Sélectionnez l’instance de base de données à mettre à jour.
  4. Cliquez sur Modifier dans le coin supérieur droit.
  5. Saisissez une valeur pour Taille du nœud du pool HA (y compris le nœud principal).
  6. Activez l’option Activer les secondaires accessibles en lecture.
  7. Cliquez sur Enregistrer.

friser

curl -s -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" $DBR_URL/database/instances/my-instance -d '{ “node_count”: 3, “enable_readable_secondaries” : true}'

Kit de développement logiciel (SDK) Python

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance

# Initialize the Workspace client
w = WorkspaceClient()

# Create a database instance with high availability
instance = w.database.create_database_instance(
    DatabaseInstance(
        name="my-database-instance",
        capacity="CU_1",
        node_count=3,  # Set the number of high availability nodes (including primary)
    )
)

print(f"Created database instance: {instance.name}")
print(f"Connection endpoint: {instance.read_write_dns}")

Interface de ligne de commande (CLI)

# Create a database instance
databricks database create-database-instance my-database-instance \
  --capacity CU_1 \
  --node-count 3

Résilience de calcul

Avec les nœuds à haute disponibilité configurés, le nœud principal de votre instance de base de données est protégé par la haute disponibilité. Si le nœud principal devient indisponible, l’instance de base de données bascule automatiquement vers un nœud secondaire en le promouvant comme nouveau nœud principal. Comme les nœuds de calcul sont sans état, les échecs n’affectent pas vos données et votre chaîne de connexion reste inchangée. L’indisponibilité est résolue en secondes en minutes, en fonction du type de défaillance. Pendant un basculement, les connexions actives sont supprimées. Votre application doit donc être configurée pour gérer ces brèves déconnexions et se reconnecter automatiquement.

Les nœuds secondaires de votre instance de base de données sont également récupérés automatiquement en minutes lorsque des problèmes se produisent. Si vous activez les secondaires accessibles en lecture, Databricks recommande de disposer d’au moins trois nœuds à haute disponibilité, au cas où le basculement principal affecte la connexion en lecture seule. Votre application a toujours besoin d’un mécanisme de reconnexion pour gérer le bref temps d’arrêt.

Exécuter des requêtes en lecture seule à partir de l’Éditeur SQL Azure Databricks

Pour vous connecter à vos fichiers secondaires lisibles et exécuter des requêtes en lecture seule à partir de l’éditeur SQL Azure Databricks, consultez Accéder à une instance de base de données à partir de l’éditeur SQL.

Limites

  • Les performances prennent du temps à récupérer. Les requêtes peuvent s’exécuter plus lentement jusqu’à ce qu’elles soient reconstruites, car le nouveau nœud principal n’a pas de données spécifiques à la session et un cache local pour les données fréquemment sollicitées.
  • La réplication interrégion n’est pas prise en charge. En cas de panne à l’échelle de la région, la disponibilité dépend du service de restauration du fournisseur de cloud dans la région concernée.