Udostępnij przez


Nawiązywanie połączenia z główną lokalizacją zewnętrzną systemu plików DBFS (starsza wersja)

Na tej stronie opisano sposób nawiązywania połączenia z lokalizacją zewnętrzną magazynu głównego systemu plików usługi Databricks (DBFS). Po nawiązaniu połączenia można zarządzać dostępem do obiektów w magazynie głównym systemu plików DBFS przy użyciu wykazu aparatu Unity.

Chociaż usługa Databricks odradza przechowywanie danych w głównej pamięci masowej DBFS, obszar roboczy może to robić ze względu na starsze praktyki. Na przykład lokalny obszar roboczy, starszy magazyn metadanych usługi Azure Databricks Hive może przechowywać dane w katalogu głównym systemu plików DBFS. Postępuj zgodnie z tym przewodnikiem, aby nawiązać połączenie z katalogiem głównym systemu plików DBFS, tworząc najpierw obiekt poświadczeń magazynu , który umożliwia dostęp do katalogu głównego systemu plików DBFS, a następnie obiekt lokalizacji zewnętrznej definiujący ścieżkę do katalogu głównego systemu plików DBFS. Te obiekty umożliwiają nawiązywanie połączenia ze starszym magazynem metadanych Hive, dzięki czemu zespół może pracować z tabelami magazynu metadanych Hive przy użyciu wykazu aparatu Unity. Zobacz Federacja magazynu metadanych Hive: włącz Katalog Unity, aby zarządzać tabelami zarejestrowanymi w magazynie metadanych Hive. Włącz federację magazynu metadanych Hive dla starszego obszaru roboczego.

Przed rozpoczęciem

Aby utworzyć lokalizację zewnętrzną dla głównego systemu plików DBFS, musisz mieć poświadczenie magazynu zdefiniowane w Unity Catalog, które zapewnia dostęp do lokalizacji przechowywania w chmurze dla głównego systemu plików DBFS. Jeśli jeszcze go nie masz, system może go utworzyć podczas procesu tworzenia lokalizacji zewnętrznej.

Wymagania dotyczące uprawnień:

  • Musisz mieć uprawnienia CREATE STORAGE CREDENTIAL i CREATE EXTERNAL LOCATION w metasklepie. Administratorzy magazynu metadanych domyślnie mają te uprawnienia.

    Note

    Jeśli już istnieje poświadczenie magazynu dla lokalizacji głównej systemu plików DBFS, użytkownik, który tworzy lokalizację zewnętrzną, nie potrzebuje CREATE STORAGE CREDENTIAL, ale wymaga CREATE EXTERNAL LOCATION do poświadczenia magazynu i magazynu metadanych.

  • Aby system utworzył dla ciebie poświadczenia magazynu podczas tworzenia zewnętrznej lokalizacji, musisz administrować obszarem roboczym.

    Nie musisz być administratorem obszaru roboczego, jeśli poświadczenie magazynujące, które daje dostęp do głównej lokalizacji magazynu DBFS, już istnieje i masz CREATE EXTERNAL LOCATION zarówno na poświadczeniu magazynującym, jak i w metadanych.

Tworzenie lokalizacji zewnętrznej

Eksplorator wykazu umożliwia utworzenie lokalizacji zewnętrznej dla katalogu głównego systemu plików DBFS.

  1. Na pasku bocznym kliknij ikonę Dane.Wykaz.

  2. Kliknij Zewnętrzne dane > i Utwórz Lokalizację Zewnętrzną.

  3. Wprowadź nazwę lokalizacji zewnętrznej .

  4. W typie przechowywania wybierz DBFS Root.

    Pola adresu URL i ścieżki podrzędnej są wypełniane ścieżką magazynu w chmurze do głównego katalogu DBFS.

    Important

    Podczas tworzenia lokalizacji zewnętrznej dla głównego systemu plików DBFS należy użyć ścieżki podrzędnej do lokalizacji głównej systemu plików DBFS, a nie ścieżki do całego zasobnika. Adres URL i ścieżka podrzędna są wstępnie wypełniane elementem user/hive/warehouse, który jest domyślną lokalizacją przechowywania tabel magazynu metadanych Hive. Jeśli chcesz uzyskać bardziej szczegółową kontrolę dostępu do danych w katalogu głównym systemu plików DBFS, możesz utworzyć oddzielne lokalizacje zewnętrzne dla ścieżek podrzędnych w katalogu głównym systemu plików DBFS.

    Warning

    Korzeń DBFS może być przechowywany w usłudze Azure Blob Storage zamiast w usłudze Azure Data Lake Storage. Te lokalizacje są dostępne przy użyciu sterownika wasb, który nie zezwala na kontrolki na poziomie katalogu ani plików. W związku z tym Unity Catalog może wymusić kontrolę dostępu tylko na poziomie kontenera, co oznacza, że użytkownicy z dostępem do tej lokalizacji zewnętrznej mogą potencjalnie uzyskać dostęp do innych danych w obrębie tego samego kontenera, jeśli używają zasobów obliczeniowych z trybem dostępu dedykowanego (dawniej tryb dostępu pojedynczego użytkownika). Aby temu zapobiec, wymusić użycie standardowych zasobów obliczeniowych trybu dostępu (dawniej trybu dostępu współdzielonego), magazynów SQL lub bezserwerowych zasobów obliczeniowych.

  5. Wybierz poświadczenie magazynu, które przyznaje dostęp do głównej lokalizacji magazynu w chmurze DBFS lub, jeśli żadne nie zostało zdefiniowane, kliknij + Utwórz nowe poświadczenie magazynu.

    Poświadczenia magazynu są tworzone automatycznie podczas zapisywania lokalizacji zewnętrznej.

  6. (Opcjonalnie) Dodaj komentarz.

  7. (Opcjonalnie) Kliknij pozycję Opcje zaawansowane i włącz tryb awaryjny .

    Tryb rezerwowy jest przeznaczony dla starszych scenariuszy migracji obciążeń. Zobacz Włączanie trybu rezerwowego w lokalizacjach zewnętrznych.

  8. Kliknij pozycję Utwórz.

  9. Przejdź do karty Uprawnienia, aby przyznać uprawnienia do używania lokalizacji zewnętrznej.

    1. Kliknij Grant.
    2. W polu Principals wybierz użytkowników, grupy lub jednostki usługi, a następnie wybierz uprawnienie, które chcesz przyznać.
    3. Kliknij Grant.
  10. (Opcjonalnie) Ustaw obszary robocze, które mogą uzyskiwać dostęp do tej lokalizacji zewnętrznej.

    Domyślnie użytkownicy w każdym obszarze roboczym korzystającym z metastore Unity Catalog mogą uzyskać dostęp do danych w tej lokalizacji. Możesz ograniczyć dostęp do określonych obszarów roboczych. Usługa Databricks zaleca ograniczenie dostępu do obszaru roboczego, w ramach którego znajduje się główny system plików DBFS.

    Zobacz Wiązanie lokalizacji zewnętrznej z co najmniej jednym obszarem roboczym.