Udostępnij przez


Domyślne przechowywanie na platformie Databricks

Na tej stronie wyjaśniono, jak działa domyślny magazyn w usłudze Azure Databricks oraz jak tworzyć wykazy i obiekty danych, które go używają.

Co to jest magazyn domyślny?

Magazyn domyślny to w pełni zarządzana platforma magazynu obiektów, która zapewnia gotowy do użycia magazyn na koncie usługi Azure Databricks. Niektóre funkcje usługi Azure Databricks używają domyślnego magazynu jako alternatywy dla magazynu zewnętrznego.

Obszary robocze bezserwerowe używają domyślnego przechowywania na potrzeby przechowywania wewnętrznego i roboczego oraz domyślnego katalogu, który jest tworzony razem z obszarem roboczym. W obszarach roboczych bezserwerowych można utworzyć dodatkowe wykazy w domyślnym magazynie lub we własnym magazynie obiektów w chmurze.

W klasycznych i bezserwerowych obszarach roboczych domyślny magazyn jest używany przez funkcje do przechowywania takich elementów jak metadane płaszczyzny sterowania, dane pochodne, modele i inne artefakty. Na przykład Clean Rooms, Klasyfikacja Danych, wykrywanie anomalii i Agent Bricks używają domyślnego magazynu obszaru roboczego. Zapoznaj się z dokumentacją poszczególnych funkcji, aby uzyskać szczegółowe informacje o tym, co każda funkcja przechowuje w magazynie domyślnym.

Wymagania

Tworzenie nowego wykazu

Wykonaj następujące kroki, aby utworzyć nowy wykaz przy użyciu magazynu domyślnego:

  1. Kliknij ikonę Dane.Wykaz na pasku bocznym. Pojawi się Eksplorator wykazu.
  2. Kliknij pozycję Utwórz katalog. Zostanie wyświetlone okno dialogowe Tworzenie nowego wykazu .
  3. Podaj nazwę wykazu , która jest unikatowa na Twoim koncie.
  4. Wybierz opcję Użyj magazynu domyślnego.
  5. Kliknij pozycję Utwórz.

W obszarach roboczych bezserwerowych można również użyć następującego polecenia SQL, aby utworzyć nowy katalog w magazynie domyślnym. Nie trzeba określać lokalizacji katalogu.

CREATE CATALOG [ IF NOT EXISTS ] catalog_name
    [ COMMENT comment ]

Praca z magazynem domyślnym

Wszystkie interakcje z magazynem domyślnym wymagają przetwarzania bezserwerowego z obsługą wykazu aparatu Unity.

Zasoby wspierane przez magazyn domyślnie używają tego samego modelu uprawnień co inne obiekty w wykazie aparatu Unity. Musisz mieć wystarczające uprawnienia do tworzenia, wyświetlania, wykonywania zapytań lub modyfikowania obiektów danych. Zobacz uprawnienia Katalogu Unity i obiekty podlegające zabezpieczeniom.

Domyślnie pracujesz z magazynem przez tworzenie i interakcję z zarządzanymi tabelami i woluminami zarządzanymi obsługiwanymi domyślnie. Zobacz tabele zarządzane przez Unity Catalog w Azure Databricks dla Delta Lake i Apache Iceberg oraz Co to są woluminy katalogu Unity?.

Eksplorator wykazu, notesy, edytor SQL i pulpity nawigacyjne umożliwiają interakcję z obiektami danych przechowywanymi w domyślnym magazynie.

Przykładowe zadania

Poniżej przedstawiono przykłady zadań, które można wykonać z magazynem domyślnym:

Ograniczenia

Obowiązują następujące ograniczenia:

  • Klasyczne zasoby obliczeniowe (bezserwerowe) nie mogą wchodzić w interakcje z elementami zawartości danych w domyślnym magazynie.
  • Udostępnianie różnicowe obsługuje udostępnianie tabel wszystkim adresatom — otwartym lub Azure Databricks — a adresaci mogą uzyskiwać dostęp do udostępnionych tabel (beta) przy użyciu klasycznych obliczeń. Włącz funkcję Delta Sharing dla domyślnego magazynu – rozszerzony dostęp w konsoli konta.
    • Ta funkcja nie jest obsługiwana w następujących regionach: southcentralus, uksouthi westus2.
    • Wszystkie inne współużytkowane zasoby mogą być udostępniane tylko adresatom usługi Azure Databricks w tej samej chmurze. Adresaci muszą używać bezserwerowych obliczeń.
  • Tabele z włączonym partycjonowaniem nie mogą być udostępniane przez funkcję delta.
  • Zewnętrzni klienci Iceberg i Delta nie mogą bezpośrednio uzyskiwać dostępu do leżących u podstaw metadanych, listy manifestów i plików danych dla tabel UC w domyślnej pamięci masowej (dostęp do FileIO nie jest obsługiwany). Jednak narzędzia analizy biznesowej, takie jak Power BI i Tableau, mogą uzyskiwać dostęp do tabel katalogu Unity w domyślnym magazynie, korzystając ze sterowników ODBC i JDBC. Klienci zewnętrzni mogą również uzyskiwać dostęp do woluminów Unity Catalog w domyślnym magazynie przy użyciu interfejsu API plików.
  • Magazyn domyślny obsługuje zewnętrzny dostęp za pośrednictwem sterowników ODBC i JDBC w Azure Databricks, w tym optymalizację wydajności sterownika ODBC z funkcją Cloud Fetch dla zapytań dotyczących większych zestawów danych. Jednakże, jeśli uzyskujesz dostęp do domyślnej tabeli przechowywania z obszaru roboczego z włączoną funkcją Private Link dla interfejsu frontowego, zapytania klienta ODBC przekraczające 100 MB nie powiodą się, ponieważ optymalizacja pobierania z chmury dla domyślnych tabel przechowywania nie obsługuje aktualnie funkcji Private Link dla interfejsu frontowego.