Delen via


Naslaginformatie voor systeemtabel Zerobus Ingest

Dit artikel is een referentie voor de zerobus-systeemtabellen, die Zerobus Ingest-activiteit in uw werkruimte bijhouden. Deze tabellen bevatten uw accountrecords uit alle werkruimten in dezelfde regio. Als u records uit een andere regio wilt zien, moet u de tabellen bekijken uit een werkruimte die in die regio is geïmplementeerd.

Requirements

  • Voor toegang tot deze systeemtabellen moeten gebruikers het volgende doen:
    • Zowel een metastore-beheerder als een werkruimtebeheerder zijn, of
    • Beschikken over USE- en SELECT machtigingen voor de systeemschema's. Zie Verleen toegang tot systeemtabellen.

Beschikbare Ingest-tabellen van Zerobus

Alle Zerobus Ingest-gerelateerde systeemtabellen leven in het system.lakeflow schema. Dit omvat de volgende tabellen:

Table Description Ondersteunt streaming Gratis bewaarperiode Bevat globale of regionale gegevens
Zerobus_stream (bèta) Houdt alle streams bij die zijn gemaakt met Zerobus Ingest Yes 365 dagen Regionaal
Zerobus_ingest (bèta) Houdt alle gegevens bij die zijn opgenomen in Delta-tabellen met behulp van Zerobus Ingest Yes 365 dagen Regionaal

Schemareferentie voor zerobus-streamtabel

In de zerobus_stream tabel worden alle gegevens opgeslagen die betrekking hebben op streamgebeurtenissen die zijn gemaakt door het gebruik van Zerobus Ingest. Dit omvat gebeurtenissen die optreden wanneer een stream wordt gemaakt, wanneer er een fout optreedt tijdens de levensduur van de stream en wanneer een stream wordt gesloten.

Tabelpad: system.lakeflow.zerobus_stream

Kolomnaam Gegevenstype Description Example
account_id touw De id van het account dat verantwoordelijk is voor de stream 23e22ba4-87b9-4cc2-9770-d10b894bxx
workspace_id touw De ID van de werkruimte die voor deze stream verantwoordelijk is 1234567890123456
stream_id touw De id van de stream ccr4bf53-127a-4487-camr-cab42c2db9b2
event_time tijdstempel De tijdstempel van het moment waarop de gebeurtenis heeft plaatsgevonden 2025-12-19T18:20:26.994+00:00
producer_id touw De id van de producent die verantwoordelijk is voor het maken van de stream Deze kolom wordt momenteel niet ondersteund.
opened_time tijdstempel De tijdstempel van het moment waarop de stream is geopend 2025-12-19T18:20:27.209+00:00
closed_time tijdstempel De tijdstempel van het moment waarop de stream werd gesloten 2025-12-19T18:20:26.994+00:00
table_id touw De id van de tabel die wordt opgenomen in 0c5ca387-5v3c-4308-90ad-b91dedb22e32
table_name touw De volledig gekwalificeerde naam van de tabel die wordt opgenomen in example_table
protocol touw Het protocol dat wordt gebruikt voor het opnemen van gegevens. Mogelijke waarden zijn GRPC en HTTP. GRPC
data_format touw De indeling van gegevens die in de stream worden gebruikt. Mogelijke waarden zijn PROTOBUF en JSON. PROTOBUF
errors gegevensreeks Matrix van fouten die zijn opgetreden tijdens de levensduur van de stream Zie Foutenreferentie

Voorbeeldquery's voor de streamtabel

De volgende query retourneert het aantal momenteel geopende streams voor een opgegeven tabel:

SELECT COUNT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE stream.table_id=:table_id AND stream.closed_time IS NULL AND stream.opened_time > CURRENT_TIMESTAMP - INTERVAL '15 minutes'

De volgende query retourneert de id's van alle streams die een fout hebben veroorzaakt:

SELECT DISTINCT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE size(stream.errors) > 0

Naslaginformatie over tabelschema's van Zerobus opnemen

In de zerobus_ingest tabel worden alle gegevens opgeslagen die zijn opgenomen met behulp van Zerobus Ingest. Deze gegevens zijn niet gedetailleerd op recordniveau. De gegevens worden geaggregeerd door batches die naar de Delta-tabel zijn geschreven, geïdentificeerd met behulp van de commit_version.

Tabelpad: system.lakeflow.zerobus_ingest

Kolomnaam Gegevenstype Description Example
account_id touw Id van het account dat eigenaar is van de opgegeven werkruimte 23e22ba4-87b9-4cc2-9770-d10b894bxx
workspace_id touw Id van de werkruimte waarin de stream is gemaakt 1234567890123456
stream_id touw Id van de stream die de opname heeft uitgevoerd ccr4bf53-127a-4487-camr-cab42c2db9b2
commit_version Bigint Uniek versienummer van de doorvoering naar de Delta 15104
table_id touw Id van de tabel waarnaar wordt geschreven 0c5ca387-5v3c-4308-90ad-b91dedb22e32
table_name touw Volledig gekwalificeerde tabelnaam in menselijk leesbaar formaat example_table
commit_time tijdstempel Tijdstempel van de doorvoer 2025-12-19T18:20:27.209+00:00
committed_bytes Bigint Grootte van de opgenomen gegevens in bytes 3532498
committed_records Bigint Aantal vastgelegde records 3445
tags gegevensreeks Aangepaste tags van Zerobus Ingest die kunnen worden gebruikt voor het bijhouden van de oorsprong van gebruik en andere metagegevens ["DIRECT_WRITE"]
errors gegevensreeks Array van fouten die zijn opgetreden tijdens de invoer Zie Foutenreferentie

Voorbeeldquery's voor de opnametabel

Met de volgende query wordt de gemiddelde invoegsnelheid voor elke tabel tijdens een opgegeven tijdsbereik opgehaald:

SELECT ingest.table_id AS table_id, SUM(ingest.committed_bytes) / (SECONDS(:end_timestamp - :start_timestamp)) AS average_insertion_rate
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp
GROUP BY ingest.table_id

Met de volgende query wordt de totale hoeveelheid gegevens en records opgehaald die tijdens een opgegeven tijdsbereik in een tabel zijn opgenomen:

SELECT SUM(ingest.committed_bytes) as 'Total data', SUM(ingest.committed_records) as 'Total records'
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp AND ingest.table_name = :table_name

Foutenreferentie

Zowel de stream- als opnametabellen bevatten een errors kolom, die een matrix met fouten bevat die zijn opgetreden tijdens de stream of opname, waarbij elk element een afzonderlijke fout vertegenwoordigt. Deze matrixelementen worden vastgelegd als objecten met de volgende velden:

Veldnaam Gegevenstype Description
error_code Bigint Foutcode
error_message touw Volledig foutbericht
timestamp tijdstempel Tijdstempel van wanneer de fout is opgetreden

Algemene koppelingspatronen

De volgende query laat zien hoe u de stream kunt samenvoegen en tabellen kunt opnemen om alle tabellen te retourneren die vanuit één werkruimte zijn geschreven.

SELECT DISTINCT(stream.table_id)
FROM system.lakeflow.zerobus_stream AS stream INNER JOIN system.lakeflow.zerobus_ingest AS ingest ON (stream_id)
WHERE stream.workspace_id=:workspace_id