Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
S’applique à :
Databricks SQL
Actualisez les données d’un streaming de tableau ou d’une vue matérialisée. Les données sont actualisées de manière synchrone par défaut.
Vous pouvez suivre le statut de l’actualisation en exécutant DESCRIBE EXTENDED.
Remarque
Les opérations de création et d’actualisation sur les vues matérialisées et les tables de flux sont alimentées par des pipelines déclaratifs Lakeflow Spark. Vous pouvez utiliser l’Explorateur de catalogues pour afficher des détails sur les pipelines de stockage dans l’interface utilisateur. Consultez Qu’est-ce que Catalog Explorer ?.
Syntaxe
REFRESH { MATERIALIZED VIEW | [ STREAMING ] TABLE } table_name [ FULL | { SYNC | ASYNC }]
Paramètres
-
Identifie la vue matérialisée ou le tableau de streaming à actualiser. Le nom ne doit pas inclure de spécification temporelle ou de spécification d’options. Si le tableau est introuvable, Azure Databricks génère une erreur TABLE_OR_VIEW_NOT_FOUND.
COMPLET
Indique s’il faut effectuer une actualisation complète.
- Pour les vues matérialisées, une actualisation complète traite toutes les données disponibles dans la source.
- Pour les tables de streaming, une actualisation complète tronque la table et traite toutes les données disponibles dans la source avec la dernière définition de la table de streaming.
Il n’est pas recommandé d’appeler des actualisations complètes sur des sources qui ne conservent pas l’intégralité de l’historique des données ou qui ont des périodes de rétention courtes, telles que Kafka, car l’actualisation complète tronque les données existantes. Vous ne pourrez peut-être pas récupérer d’anciennes données si les données ne sont plus disponibles dans la source.
SYNC
Indique s’il faut effectuer une actualisation synchrone. La commande se bloque jusqu'à ce que la vue matérialisée ou la table de streaming soit créée et que le chargement initial des données soit terminé.
C’est le paramétrage par défaut.
ASYNCHRONE
Indique s'il faut effectuer une actualisation asynchrone, qui démarre un processus en arrière-plan sur Lakeflow Spark Declarative Pipelines. La commande revient immédiatement, avant que le chargement des données ne soit terminé, avec un lien vers le pipeline qui soutient la vue matérialisée ou la table de diffusion en continu. Vous pouvez consulter le lien pour voir l’état d’avancement de l’actualisation.
Vous devez spécifier
ASYNCsi vous souhaitez effectuer des actualisations asynchrones. L’opération est effectuée de manière synchrone si aucun mot clé n’est spécifié.
Exemples
-- Refreshes the materialized view to reflect the latest available data
> REFRESH MATERIALIZED VIEW catalog.schema.view_name;
-- Refreshes the streaming table to process the latest available data
-- The current catalog and schema will be used to qualify the table
> REFRESH STREAMING TABLE st_name;
-- Truncates the table and processes all data from scratch for the streaming table
> REFRESH STREAMING TABLE cat.db.st_name FULL;