Udostępnij przez


Używanie tagów do przypisywania i śledzenia użycia

W tym artykule wyjaśniono, jak używać tagów do przypisywanie użycia zasobów obliczeniowych do określonych obszarów roboczych, zespołów, projektów lub użytkowników w celu obsługi śledzenia kosztów i budżetowania.

Istnieją dwa typy tagów:

  • Tagi domyślne: automatycznie stosowane przez usługę Databricks do zasobów wdrożonych w chmurze. Zapewniają one podstawowe metadane, takie jak dostawca, identyfikator klastra i twórca.
  • Tagi niestandardowe: tagi zdefiniowane przez użytkownika, które można dodać do zasobów obliczeniowych i obciążeń bezserwerowych. Umożliwiają one szczegółowe śledzenie, raportowanie i budżetowanie.

Ostrzeżenie

Dane tagów są przechowywane jako zwykły tekst i mogą być replikowane globalnie. Nie używaj nazw tagów, wartości ani deskryptorów, które mogą naruszyć bezpieczeństwo zasobów. Na przykład nie należy używać nazw tagów, wartości ani deskryptorów zawierających informacje osobiste lub poufne.

Tagi domyślne

Usługa Azure Databricks automatycznie dodaje tagi domyślne do zasobów obliczeniowych wdrażanych na koncie chmury. Tagi te przypiszeją użycie do usługi Databricks i udostępniają podstawowe informacje o zasobie, takie jak jego nazwa, identyfikator i twórca.

Tagi domyślne są automatycznie propagowane do szczegółowych raportów analizy kosztów , do których można uzyskać dostęp w witrynie Azure Portal.

Oto raport analizy kosztów i szczegóły faktury w portalu Azure, który szczegółowo opisuje koszty według clusterid tagu w okresie jednego miesiąca.

Analiza kosztów według identyfikatora klastra

Domyślne klucze i wartości tagów

Usługa Azure Databricks dodaje następujące tagi domyślne do zasobów obliczeniowych:

Klucz tagu Wartość
Vendor Stała wartość: Databricks
ClusterId Identyfikator wewnętrzny klastra Azure Databricks
ClusterName Nazwa klastra
Creator Nazwa użytkownika (adres e-mail) użytkownika, który utworzył klaster
RunName Nazwa zadania (propaguje się tylko w obliczeniach zadań). Jeśli używasz interfejsu API zadań w wersji 2.0, jest to równoważne z run_name. W API zadań 2.1 jest to task_key.
JobId Identyfikator zadania (propaguje się tylko w obliczeniach zadań)

Obliczenia używane przez profilowanie danych obejmują następujące dodatkowe tagi:

Klucz tagu Wartość
LakehouseMonitoring prawda
LakehouseMonitoringTableId Identyfikator monitorowanej tabeli
LakehouseMonitoringWorkspaceId Identyfikator obszaru roboczego, w którym utworzono monitor
LakehouseMonitoringMetastoreId Identyfikator magazynu metadanych, w którym istnieje monitorowana tabela

Usługa Azure Databricks dodaje następujące tagi domyślne do pul i zasobów obliczeniowych utworzonych przez pule.

Klucz tagu Wartość
Vendor Stała wartość: Databricks
DatabricksInstancePoolCreatorId Wewnętrzny identyfikator usługi Azure Databricks użytkownika, który utworzył pulę
DatabricksInstancePoolId Wewnętrzny identyfikator puli usługi Azure Databricks

Tagi niestandardowe

Tagi niestandardowe umożliwiają przypisywanie użycia zasobów obliczeniowych do określonych zespołów, projektów lub centrów kosztów z większą szczegółowością niż tagi domyślne. Te tagi są stosowane przez użytkowników lub administratorów i propagowane zarówno do dzienników użycia konta, jak i odpowiednich zasobów w chmurze. Te tagi służą również do tworzenia i monitorowania budżetów na koncie usługi Azure Databricks.

Obsługiwane zasoby dla tagów niestandardowych

Objekt Interfejs znakowania (UI) Interfejs tagowania (API)
Obszar roboczy Portal Azure Interfejs API zasobów platformy Azure
Pula Interfejs użytkownika pul w obszarze roboczym usługi Azure Databricks API puli wystąpień
Wielozadaniowe i wszechstronne obliczenia Interfejs użytkownika obliczeń w obszarze roboczym usługi Azure Databricks Interfejs API klastrów
SQL Warehouse Interfejs użytkownika usługi SQL Warehouse w obszarze roboczym usługi Azure Databricks Interfejs API magazynów
Wystąpienie bazy danych Interfejs użytkownika wystąpienia bazy danych w obszarze roboczym usługi Azure Databricks Interfejs API wystąpień bazy danych

Tagi niestandardowe są wyświetlane małymi literami w dziennikach GCE. Znaki są usuwane, jeśli nie są literami, cyframi, podkreśleniami lub kreskami. Na przykład My Key staje się mykey i My.Val staje się myval.

Ostrzeżenie

Nie przypisuj tagu niestandardowego z kluczem Name do klastra. Każdy klaster ma tag Name, którego wartość jest ustawiana przez usługę Azure Databricks. Jeśli zmienisz wartość skojarzona z kluczem Name, klaster nie może być już śledzony przez usługę Azure Databricks. W związku z tym klaster może nie zostać przerwany po stanie bezczynności i będzie nadal ponosić koszty użycia.

Tagowanie bezserwerowych obciążeń obliczeniowych

Ważny

Funkcja ta jest dostępna w publicznej wersji zapoznawczej . Rejestrację w wersji zapoznawczej można potwierdzić na stronie Podglądy . Zobacz Zarządzanie wersjami zapoznawczami usługi Azure Databricks.

Aby przypisywać bezserwerowe użycie zasobów obliczeniowych użytkownikom, grupom lub projektom, można użyć bezserwerowych zasad budżetu. Gdy użytkownikowi przypisano politykę budżetową dla rozwiązań bezserwerowych, ich wykorzystanie zasobów bezserwerowych jest automatycznie oznaczane niestandardowymi tagami polityki. Bezserwerowe zasady budżetu można stosować do notesów bezserwerowych, zadań, potoków i modeli obsługujących punkty końcowe.

Uwaga / Notatka

Użycie zasobów obliczeniowych w modelu bezserwerowym jest rejestrowane w tabeli systemowej rozliczalnego użycia na koncie. Starsze raporty użycia jednostek DBU nie obejmują użycia bezserwerowego ani tagów zasad budżetu bezserwerowego.

Zobacz Użycie atrybutów przy użyciu zasad budżetu bezserwerowego.

Propagacja tagów

Tagi obszarów roboczych, puli i klastra są agregowane przez usługę Azure Databricks i propagowane do maszyn wirtualnych platformy Azure na potrzeby raportowania analizy kosztów. Jednak tagi puli i klastra są propagowane w różny sposób.

Tagi obszaru roboczego i puli są agregowane i przypisywane jako tagi zasobów maszyn wirtualnych platformy Azure hostujących pule.

Tagi obszaru roboczego i klastra są agregowane i przypisywane jako tagi zasobów maszyn wirtualnych platformy Azure hostujących klastry.

Gdy klastry są tworzone na podstawie pul, tylko tagi obszaru roboczego i tagi puli są propagowane do maszyn wirtualnych. Tagi klastra nie są propagowane, aby zachować wydajność uruchamiania klastrów w puli.

Rozwiązywanie konfliktów związanych z tagami

Jeśli tag niestandardowy (obszar roboczy, klaster lub tag puli) ma taką samą nazwę klucza jak domyślny tag usługi Azure Databricks, tag niestandardowy jest automatycznie poprzedzony prefiksem x_ podczas propagacji. Domyślny tag usługi Azure Databricks zachowuje oryginalną nazwę klucza.

Na przykład usługa Azure Databricks stosuje domyślny tag vendor = Databricks klastra do wszystkich klastrów. Jeśli dodasz niestandardowy tag vendor = Azure Databricksobszaru roboczego, spowoduje to konflikt z tagiem domyślnym vendor . Po propagacji na platformę Azure niestandardowy tag obszaru roboczego staje się x_vendor = Azure Databricks, a domyślny tag usługi Azure Databricks pozostaje jako vendor = Databricks.

Ostrzeżenie

Konflikt tagów niestandardowych dodanych za pomocą zasad obliczeniowych nie jest rozwiązywany, co powoduje niepowodzenie klastra lub puli z powodu nieprawidłowego błędu ustawień. Upewnij się, że zasady obliczeniowe nie dodają żadnych nazw tagów powodujących konflikt.

:::

Egzekwowanie tagów

Aby wymusić użycie określonych tagów niestandardowych, można użyć zasad obliczeniowych. Zobacz Wymuszanie niestandardowych tagów. Aby wymusić na bezserwerowych obciążeniach obliczeniowych tagi niestandardowe, użyj polityki budżetowej bezserwerowej.

Ograniczenia

  • Propagacja niestandardowych tagów obszaru roboczego do usługi Azure Databricks po każdej zmianie może potrwać do godziny.
  • Do zasobu platformy Azure nie można przypisać więcej niż 50 tagów. Jeśli ogólna liczba zagregowanych tagów przekroczy ten limit, x_-prefiksowane tagi są oceniane w kolejności alfabetycznej, a te, które przekraczają limit, są ignorowane. Jeśli wszystkie tagi z prefiksem x_są ignorowane, a liczba nadal przekracza limit, pozostałe tagi są oceniane w kolejności alfabetycznej, a te, które przekraczają limit, są ignorowane.
  • Klucze tagów i wartości mogą zawierać tylko litery, spacje, cyfry lub znaki +, -, =, ., _, :, /, @. Tagi zawierające inne znaki są nieprawidłowe.
  • Jeśli zmienisz nazwy lub wartości klucza tagu, te zmiany będą stosowane tylko po ponownym uruchomieniu klastra lub rozszerzeniu puli.
  • Gdy tagi niestandardowe klastra konfliktują z tagami niestandardowymi puli, nie można utworzyć klastra.
  • Nowo dodane, zmodyfikowane lub usunięte tagi obszaru roboczego nie są automatycznie propagowane do istniejących zasobów obliczeniowych. Aby uzyskać nowe tagi do propagacji, otwórz stronę szczegółów zasobu obliczeniowego, kliknij przycisk Edytuj, a następnie potwierdź i uruchom ponownie.