Udostępnij przez


Rozwiązywanie problemów z miejscami Genie

Na tej stronie opisano sposób rozwiązywania typowych problemów podczas tworzenia i utrzymywania przestrzeni Genie.

Niezrozumiany żargon biznesowy

Większość firm lub domen ma określone skróty, których używają do komunikowania się o wydarzeniach specyficznych dla branży. Na przykład w przypadku odwoływania się do roku może to zawsze oznaczać rok obrachunkowy, a ten rok obrachunkowy może rozpoczynać się w lutym lub marcu zamiast stycznia. Aby umożliwić Genie naturalne i dokładne odpowiadanie na te pytania, dołącz instrukcje, które jawnie mapują żargon biznesowy na słowa i pojęcia, które Genie może zrozumieć. Zobacz Zapewnianie instrukcji.

Nieprawidłowe użycie tabeli lub kolumny

Jeśli usługa Genie próbuje ściągnąć dane z nieprawidłowej tabeli lub uruchomić analizę nieprawidłowych kolumn, możesz dostosować dane w jeden z następujących sposobów:

  • Podaj jasne i dokładne opisy: Sprawdź tabele i skojarzone metadane, aby sprawdzić, czy używana terminologia jest zgodna z terminologią użytkowników w przesłanych pytaniach. Jeśli tak nie jest, uściślij opis lub dodaj instrukcję, która mapuje terminologię używaną w tabeli do terminologii używanej w pytaniu.
  • Dodaj przykładowe zapytania: podaj przykładowe zapytania SQL, których usługa Genie może użyć, aby dowiedzieć się, jak odpowiedzieć na określone pytania. Zobacz Zapewnianie instrukcji.
  • Usuwanie tabel lub kolumn z przestrzeni: Niektóre tabele mogą zawierać nakładające się kolumny lub pojęcia, które utrudniają Genie ustalenie, które dane powinny być używane w odpowiedzi. Jeśli to możliwe, usuń niepotrzebne lub nakładające się tabele lub kolumny. Aby ukryć kolumny z interfejsu użytkownika obszaru Genie bez zmieniania bazowych obiektów danych, zobacz Ukrywanie lub pokazywanie odpowiednich kolumn.

Błędy filtrowania

Wygenerowane zapytania często zawierają klauzulę filtrowania WHERE wyników zgodnie z określoną wartością. Gdy usługa Genie nie ma wglądu w wartości danych, może ustawić klauzulę WHERE , aby filtrować nieprawidłową wartość. Na przykład może próbować dopasować nazwę "California", gdy w tabeli są używane skróty, takie jak "CA".

W takich sytuacjach sprawdź, czy odpowiednie kolumny mają włączone przykładowe wartości i słowniki wartości . Jeśli nowe dane zostały dodane do odpowiednich tabel, odśwież wartości. Zobacz Tworzenie magazynu wiedzy dla bardziej niezawodnych przestrzeni Genie.

Nieprawidłowe połączenia

Jeśli odwołania do klucza obcego nie są zdefiniowane w Unity Catalog, przestrzeń może nie wiedzieć, jak połączyć różne tabele.

Spróbuj zaimplementować co najmniej jedno z następujących rozwiązań:

  • Zdefiniuj odwołania do kluczy obcych w katalogu Unity, jeśli to możliwe. Zobacz CONSTRAINT klauzulę.
  • Jeśli relacje klucza obcego tabel nie są określone w katalogu aparatu Unity, zdefiniuj relacje sprzężenia w magazynie wiedzy obszaru Genie. Ta strategia jest przydatna w przypadku bardziej złożonych scenariuszy sprzężenia, takich jak sprzężenia samodzielne, lub jeśli nie masz wystarczających uprawnień do modyfikowania tabel bazowych. Zobacz Definiowanie relacji sprzężenia.
  • Podaj przykładowe zapytania, w których łączysz tabele w standardowy sposób.

Jeśli żaden z tych elementów nie rozwiąże problemu, należy zintegrować tabelę z widokiem i użyć jej jako danych wejściowych dla przestrzeni.

Komentarze kolumn nie są synchronizowane z tabel obcych

Usługa Azure Databricks nie zarządza metadanymi, danymi ani semantykami zapisów w tabelach obcych. W zależności od tabeli źródłowej komentarze mogą nie być dostępne w usłudze Azure Databricks. Aby udostępnić komentarze, usługa Azure Databricks zaleca wykonanie jednej z następujących czynności:

Problemy z obliczeniami metryk

Sposób, w jaki metryki są obliczane i agregowane, może być dowolnie skomplikowany i obejmować wiele szczegółów biznesowych, których twój dział nie rozumie. Może to prowadzić do nieprawidłowego raportowania.

Spróbuj zaimplementować co najmniej jedno z następujących rozwiązań:

  • Zdefiniuj metryki jako wyrażenia SQL w magazynie wiedzy. Wyrażenia SQL zapewniają wielokrotnego użytku, precyzyjne definicje miar, filtrów i wymiarów, które Genie może stosować spójnie. Zobacz Definiowanie wyrażeń SQL.
  • Jeśli metryki są agregowane z tabel bazowych, podaj przykładowe zapytania SQL obliczeniowe dla każdej wartości zbiorczej.
  • Jeśli metryki zostały wstępnie obliczone i znajdują się w zagregowanych tabelach, wyjaśnij to w komentarzach tabeli. Określ prawidłowe agregacje dla każdego wskaźnika, jeśli metryki w tej tabeli mogą być dodatkowo zsumowane.
  • Jeśli język SQL, który próbujesz wygenerować, jest bardzo skomplikowany, spróbuj utworzyć widoki, które już zagregowały metryki dla miejsca.

Nieprawidłowe obliczenia oparte na czasie

Genie może nie zawsze być w stanie wywnioskować strefę czasową reprezentowaną w danych lub strefę czasową, w której należy przeprowadzić analizę, chyba że jawnie podasz dodatkowe wskazówki.

Dołącz bardziej jawne instrukcje szczegółowo opisujące oryginalną strefę czasową źródła, funkcję konwersji i docelową strefę czasową. W poniższych przykładach pokazano, jak zmienić ogólne instrukcje dotyczące bardziej niezawodnych konwersji strefy czasowej:

  • Zawsze konwertuj czasy na określoną strefę czasową: w tym przykładzie załóżmy, że sygnatura czasowa źródła to UTC i chcesz uzyskać wyniki w America/Los_Angeles strefie czasowej. Dodaj następujące treści do instrukcji, zastępując <timezone-column> odpowiednią nazwą kolumny.
    • Strefy czasowe w tabelach znajdują się w UTC.
    • Przekonwertuj wszystkie strefy czasowe przy użyciu następującej funkcji: convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>).
  • Przekonwertuj formaty daty/godziny innej niż UTC na UTC: Jeśli domyślna strefa czasowa obszaru roboczego to UTC , ale użytkownicy w Los Angeles muszą odwoływać się dzisiaj do określonego zestawu rekordów, dodaj następujące informacje do ogólnych instrukcji obszaru:
    • Aby odwołać się do 'dzisiaj', użyj .

Zobacz convert_timezone funkcję , aby uzyskać więcej szczegółów i składni.

Ignorowanie instrukcji

Nawet jeśli wyjaśniłeś swoje tabele i kolumny w komentarzach i podałeś ogólne instrukcje, przestrzeń może nadal nie używać ich poprawnie.

Wypróbuj co najmniej jedną z następujących strategii:

  • Podaj przykładowe zapytania, które prawidłowo używają tabel. Przykładowe zapytania są szczególnie skuteczne w przypadku nauczania przestrzeni, w jaki sposób korzystać z danych.
  • Ukryj nieistotne kolumny w przestrzeni Genie. Zobacz Ukrywanie lub pokazywanie odpowiednich kolumn.
  • Utwórz widoki na podstawie tabel, które zapewniają prostszy widok danych.
  • Przejrzyj instrukcje i spróbuj skupić się na przestrzeni, usuwając nieistotne tabele lub instrukcje.
  • Spróbuj uruchomić nowy czat. Poprzednie interakcje mogą mieć wpływ na odpowiedzi Genie w danym czacie, ale rozpoczęcie nowego czatu daje pusty punkt wyjścia do testowania nowych instrukcji.

Problemy z wydajnością

Gdy Genie musi wygenerować wyjątkowo długie zapytania lub odpowiedzi tekstowe, reakcja może zająć dużo czasu lub nawet nastąpić przekroczenie limitu czasu przy przetwarzaniu.

Spróbuj wykonać co najmniej jedną z następujących akcji, aby zwiększyć wydajność:

  • Sprawdź historię zapytań, aby zidentyfikować wolno działające zapytania. Wiele problemów z wydajnością można rozwiązać, optymalizując wygenerowane zapytania SQL zamiast modyfikować konfigurację obszaru Genie. Przejrzyj czas wykonywania zapytań i plany zapytań w historii zapytań usługi SQL Warehouse, aby zidentyfikować wąskie gardła i możliwości optymalizacji.
  • Użyj zaufanych zasobów lub widoków, aby hermetyzować złożone zapytania. Zobacz Use trusted assets in AI/BI Genie spaces (Używanie zaufanych zasobów w przestrzeniach usługi AI/BI Genie).
  • Zmniejsz długość przykładowych zapytań SQL zawsze, gdy jest to możliwe.
  • Rozpocznij nowy czat, jeśli genie zacznie generować powolne lub kończące się niepowodzeniem odpowiedzi.

Zawodne odpowiedzi na pytania o znaczeniu krytycznym

Użyj zaufanych zasobów, aby podać zweryfikowane odpowiedzi na konkretne pytania, których oczekujesz od użytkowników. Zobacz Use trusted assets in AI/BI Genie spaces (Używanie zaufanych zasobów w przestrzeniach usługi AI/BI Genie).

Ostrzeżenie dotyczące limitu tokenu

Tokeny to podstawowe jednostki tekstu używane przez genie do przetwarzania i zrozumienia języka. Instrukcje tekstowe i metadane w przestrzeni Genie są konwertowane na tokeny. Jeśli miejsce zbliża się do limitu tokenu, zostanie wyświetlone ostrzeżenie. Usługa Genie używa filtrowania kontekstu do określania priorytetów tokenów, które uważa za najbardziej istotne dla pytania. Chociaż odpowiedzi powinny być nadal generowane po wyświetleniu ostrzeżenia, jakość może zostać zmniejszona, jeśli ważny kontekst zostanie odfiltrowany. Po przekroczeniu limitu tokenu nie można już wysyłać ani odbierać komunikatów w obszarze Genie.

Rozważ następujące rozwiązania, aby zmniejszyć liczbę tokenów:

  • Usuwanie niepotrzebnych kolumn: niepotrzebne kolumny w tabelach mogą znacząco przyczynić się do użycia tokenów. Jeśli to możliwe, utwórz widoki w celu wykluczenia nadmiarowych lub nieistotnych pól z nieprzetworzonych tabel. Możesz również ukryć niepotrzebne kolumny w przestrzeni Genie. Zobacz Ukrywanie lub pokazywanie odpowiednich kolumn.
  • Usprawnij opisy kolumn: Chociaż opisy kolumn są ważne, unikaj duplikowania informacji już przekazywanych według nazw kolumn. Jeśli na przykład kolumna ma nazwę account_name, opis taki jak "nazwa konta" może być nadmiarowy i można go pominąć.
  • Edytowanie metadanych kolumn w obszarze Genie: Zobacz Edytowanie metadanych kolumn, aby dowiedzieć się, jak edytować opisy i udostępniać synonimy w metadanych kolumn.
  • Przycinanie przykładowych zapytań SQL: uwzględnij zróżnicowany zakres przykładowych zapytań SQL w celu pokrycia różnych typów pytań, ale usuń nakładające się lub nadmiarowe przykłady.
  • Upraszczanie instrukcji: Sprawdź, czy instrukcje są jasne i zwięzłe. Unikaj niepotrzebnych słów.

Twoje konto nie jest aktywowane do przetwarzania międzyregionowego

Genie to wyznaczona usługa zarządzana przez usługę Azure Databricks. Wyznaczone usługi używają usługi Databricks Geos do zarządzania miejscem przechowywania danych. Nie można przetworzyć danych w tym samym obszarze geograficznym co obszar roboczy dla niektórych regionów. Jeśli obszar roboczy znajduje się w jednym z tych regionów, przetwarzanie między regionami musi być aktywowane przez administratora konta.

Osiąganie limitów przepływności

Podczas uzyskiwania dostępu do obszarów Genie za pośrednictwem interfejsu użytkownika Azure Databricks wydajność jest ograniczona do 20 pytań na minutę na obszar roboczy we wszystkich obszarach Genie.

W przypadku uzyskiwania dostępu do przestrzeni Genie przy użyciu bezpłatnej warstwy interfejsu API konwersacji (publiczna wersja zapoznawcza) przepustowość jest ograniczona do pięciu pytań na minutę na każdy obszar roboczy, z dołożeniem wszelkich starań we wszystkich przestrzeniach Genie. Zobacz Integrowanie usługi Genie z aplikacjami przy użyciu interfejsu API Genie.