Udostępnij przez


Obsługa wariantów w usłudze Delta Lake

Ważne

Ta funkcja jest dostępna w publicznej wersji zapoznawczej.

Możesz użyć VARIANT typu danych do przechowywania częściowo ustrukturyzowanych danych w usłudze Delta Lake. Przykłady pracy z usługą VARIANTmożna znaleźć w temacie Query variant data (Wykonywanie zapytań dotyczących danych wariantów).

Aby odczytywać i zapisywać tabele z obsługą wariantów, należy użyć środowiska Databricks Runtime w wersji 15.3 lub nowszej.

Włączanie wariantu w tabeli delty

Aby włączyć wariant, utwórz nową tabelę z kolumną VARIANT typu, na przykład:

CREATE TABLE table_name (variant_column VARIANT)

Możesz również włączyć obsługę VARIANT dla istniejącej tabeli, używając następującej składni:

ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')

Ostrzeżenie

Po włączeniu wariantu, protokół tabeli zostanie zaktualizowany. Po uaktualnieniu tabela nie będzie czytelna dla klientów Delta Lake, którzy nie obsługują wariantu. Zobacz kompatybilność funkcji Delta Lake i protokoły.

Ograniczenia

Istnieją następujące ograniczenia:

  • Nie można używać kolumn wariantów do partycjonowania tabeli.
  • Kolumna wariantu nie może być kluczem klastrowania dla tabeli.
  • Nie można używać kolumn wariantów z klauzulami GROUP BY ani ORDER BY.
  • Nie można wywołać DISTINCT w kolumnie typu wariantowego.
  • Nie można używać operatorów zestawu SQL (INTERSECT, UNION, EXCEPT) z kolumnami wariantów.
  • Nie można użyć generowania kolumn, aby utworzyć kolumnę wariantu.
  • Funkcja Delta nie zbiera minValues ani maxValues statystyk dla kolumn wariantów.
  • Kolumna wariantu nie może zawierać wartości większej niż 128 MiB (16 MiB w środowisku Databricks Runtime 17.1 i poniżej).