Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gilt für:
Databricks SQL
Databricks Runtime 11.3 LTS und höher
Gibt den Status eines Autoloader oder read_files-Streams auf Dateiebene zurück.
Syntax
cloud_files_state( { TABLE ( table_name ) | checkpoint } )
Argumente
-
table_name: Der Bezeichner der Streamingtabelle, in die von
read_filesgeschrieben wird. Der Name darf keine temporale Spezifikation enthalten. Verfügbar in Databricks Runtime 13.3 LTS und höher. -
checkpoint: EinSTRING-Literal Das Prüfpunktverzeichnis für einen Stream, der die AutoLoader-Quelle verwendet Weitere Informationen finden Sie unter "Automatisches Laden".
Gibt zurück
Gibt eine Tabelle mit dem folgenden Schema zurück:
path STRING NOT NULL PRIMARY KEYDer Pfad einer Datei.
size BIGINT NOT NULLDie Größe einer Datei in Bytes.
create_time TIMESTAMP NOT NULLDer Zeitpunkt, zu dem eine Datei erstellt wurde.
discovery_time TIMESTAMP NOT NULLGilt für:
Databricks SQL
Databricks Runtime 16.4 und höherDer Zeitpunkt, zu dem eine Datei entdeckt wurde.
processed_time TIMESTAMP NOT NULLGilt für:
Databricks SQL
Databricks Runtime 16.4 und höher, wenn cloudFiles.cleanSourceaktiviert ist. Weitere Informationen finden Sie unter "Optionen für das automatische Laden".Die Zeit, zu der eine Datei verarbeitet wurde. Wenn bei einem Batch ein Fehler auftritt und ein Wiederholungsversuch auftritt, wird eine Datei möglicherweise mehrmals verarbeitet. Wenn Wiederholungen auftreten, enthält dieses Feld die letzte Verarbeitungszeit.
commit_time TIMESTAMPGilt für:
Databricks SQL
Databricks Runtime 16.4 und höher, wenn cloudFiles.cleanSourceaktiviert ist. Weitere Informationen finden Sie unter "Optionen für das automatische Laden".Der Zeitpunkt, zu dem eine Datei nach der Verarbeitung an den Prüfpunkt committet wurde.
NULL, wenn die Datei noch nicht verarbeitet wurde. Es gibt keine garantierte Latenz zum Markieren einer Datei als zugesichert; eine Datei kann verarbeitet, aber später willkürlich als zugesichert gekennzeichnet werden. Wenn eine Datei als committet markiert wird, bedeutet dies, dass der AutoLoader die Datei nicht mehr zur Verarbeitung benötigt.archive_time TIMESTAMPGilt für:
Databricks SQL
Databricks Runtime 16.4 und höher, wenn cloudFiles.cleanSourceaktiviert ist. Weitere Informationen finden Sie unter "Optionen für das automatische Laden".Der Zeitpunkt, zu dem eine Datei archiviert wurde.
NULL, wenn die Datei nicht archiviert wurde.archive_mode STRINGGilt für:
Databricks SQL
Databricks Runtime 16.4 und höher, wenn cloudFiles.cleanSourceaktiviert ist. Weitere Informationen finden Sie unter "Optionen für das automatische Laden".MOVE, wenncloudFiles.cleanSourcebeim Archivieren der Datei aufMOVEfestgelegt wurde.DELETE, wenncloudFiles.cleanSourcebeim Archivieren der Datei aufDELETEfestgelegt wurde.NULLwenncloudFiles.cleanSourceaufOFF(Standardeinstellung) festgelegt wurde.move_location STRINGGilt für:
Databricks SQL
Databricks Runtime 16.4 und höher, wenn cloudFiles.cleanSourceaktiviert ist. Weitere Informationen finden Sie unter "Optionen für das automatische Laden".Der vollständige Pfad, zu dem die Datei während des Archivierungsvorgangs verschoben wurde, als
cloudFiles.cleanSourceaufMOVEgesetzt war.NULLwenn die Datei nicht archiviert wurde odercloudFiles.cleanSourceeine vonDELETEoderOFFist.source_id STRINGDie ID der AutoLoader-Quelle in der Streamingabfrage Dieser Wert lautet
'0'für Datenströme, die von einem einzelnen Speicherort für Cloudobjekte erfasst werden.flow_name STRINGGilt für:
Databricks SQL
Databricks Runtime 13.3 und höherStellt einen spezifischen Streamingfluss in Lakeflow Spark Declarative Pipelines dar, der eine oder mehrere Quellen für Clouddateien enthält. NULL, wenn kein table_name angegeben wurde.
ingestion_state STRINGGilt für:
Databricks SQL
Databricks Runtime 16.4 und höher, wenn cloudFiles.cleanSourceaktiviert ist. Weitere Informationen finden Sie unter "Optionen für das automatische Laden".Ob die Datei erfasst wurde, was durch einen der folgenden Zustände angezeigt wird:
-
NULL: Die Datei wurde noch nicht verarbeitet, oder der Dateistatus kann nicht vom automatischen Laden bestimmt werden. -
PROCESSING: Die Datei wird verarbeitet. -
SKIPPED_CORRUPTED: Die Datei wurde nicht aufgenommen, weil sie beschädigt war. -
SKIPPED_MISSING: Die Datei wurde nicht aufgenommen, weil sie während der Verarbeitung nicht gefunden wurde. -
INGESTED: Die Datei wurde mindestens einmal von der Senke verarbeitet. Bei Fehlern im Datenstrom kann sie erneut von nicht-idempotenten Senken wieforeachBatchverarbeitet werden. Nur Dateien mit einem Nicht-Null-commit_time-Feld, die sich imINGESTED-Zustand befinden, haben die Verarbeitung abgeschlossen. -
NOT_RECOGNIZED_BY_DBR: Für Versionskompatibilität reserviert. Dieser Zustand wird für Zustände angezeigt, die in späteren Databricks-Runtime-Versionen eingeführt wurden, die von früheren Databricks-Runtime-Versionen nicht erkannt werden.
-
Berechtigungen
Sie benötigen Folgendes:
- Bei Verwendung eines Streamingtabellenbezeichners
- Databricks Runtime 17.1 und unten:
OWNERBerechtigungen für die Streamingtabelle - Databricks SQL und Databricks Runtime 17.2 und höher:
SELECTundMODIFYBerechtigungen für die Streamingtabelle
- Databricks Runtime 17.1 und unten:
-
READ FILES-Berechtigungen für den Prüfpunktspeicherort, wenn ein Prüfpunkt unter einem externen Speicherort bereitgestellt wird.
Beispiele
-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
/some/input/path
/other/input/path
-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
/some/input/path
/other/input/path
-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
/some/input/path
/other/input/path
Einschränkungen
- Benutzer, die eine Ansicht lesen, die auf eine Streamingtabelle verweist
cloud_files_state, müssen beideSELECTBerechtigungen für die Ansicht und die erforderlichen Berechtigungen für die Streamingtabelle besitzen.