Udostępnij przez


Tworzenie magazynu wiedzy dla bardziej niezawodnych przestrzeni Genie

Magazyn wiedzy Genie umożliwia zarządzanie i ulepszanie Twojej przestrzeni roboczej dzięki użyciu zlokalizowanych metadanych, próbkowania wartości oraz ustrukturyzowanych instrukcji SQL. Te funkcje pomagają Genie zrozumieć dane i wygenerować dokładniejsze, odpowiednie odpowiedzi.

Co to jest magazyn wiedzy?

Magazyn wiedzy to zbiór wyselekcjonowanych definicji semantycznych, które zwiększają zrozumienie danych przez Genie i zwiększają dokładność odpowiedzi.

Magazyn wiedzy składa się z następujących elementów:

  • Dostosowywanie metadanych na poziomie przestrzeni: opisy specyficzne dla przestrzeni dla tabel, kolumn i terminów biznesowych oraz synonimów
  • Dostosowanie danych na poziomie domeny: uproszczone, ukierunkowane zestawy danych bez zmieniania bazowych tabel Unity Catalog
  • Próbkowanie wartości: rzeczywiste przykłady danych, które pomagają Genie zrozumieć typy danych i dopasować zapytania użytkownika do rzeczywistych wartości
  • Relacje sprzężeń: Zdefiniowane relacje tabeli dla dokładnych JOIN zapytań
  • Wyrażenia SQL: ustrukturyzowane definicje miar, filtrów i wymiarów, które przechwytują logikę biznesową

Wszystkie konfiguracje magazynu wiedzy są ograniczone do obszaru Genie i nie mają wpływu na metadane katalogu Unity ani inne zasoby usługi Azure Databricks.

Zarządzanie metadanymi magazynu wiedzy

Ucz Genie o danych w przestrzeni, udostępniając lokalne opisy tabel i kolumn oraz dodając synonimy kolumn zgodne z typowymi terminami biznesowymi. Uprość zestawy danych, ukrywając niepotrzebne lub zduplikowane kolumny, aby Genie pozostało skoncentrowane.

Te rozwiązania zwiększają użyteczność użytkowników, którzy nie mają bezpośrednich uprawnień do bazowych tabel, a także obsługują szybsze iteracji podczas aktualizowania wersji instrukcji.

Aby uzyskać dostęp do metadanych na poziomie przestrzeni, kliknij pozycję Konfiguruj > dane w przestrzeni Genie. Następnie kliknij nazwę tabeli, aby wyświetlić jej metadane i kolumny.

Wyświetlanie kolumn

Kliknij nazwę tabeli, aby wyświetlić przegląd nazw kolumn i szczegółów. Poniższy przykład przedstawia przykład z tabeli o nazwie accounts.

Omówienie tabeli przedstawiające opis metadanych i szczegóły kolumny zgodnie z poniższym opisem.

  • Opis: Usługa Genie używa metadanych do zrozumienia danych i generowania dokładnych odpowiedzi. Domyślny opis tabeli przedstawia metadane Unity Catalogu skojarzone z zasobem danych. Możesz edytować ten opis, aby dodać konkretne wskazówki, które pomagają geniuszowi tworzyć instrukcje SQL dla twojej przestrzeni. Kliknij Resetuj, aby przywrócić opis katalogu Unity.

  • Kolumny: Nazwy kolumn i opisy znajdują się na liście kolumn. Każda kolumna jest oznaczona etykietą z tagami, które pokazują, czy zawiera przykładowe wartości , czy słownik Wartości. Zobacz Omówienie próbkowania wartości.

Ukrywanie lub pokazywanie odpowiednich kolumn

Kolumny można zarządzać pojedynczo lub zbiorczo. Użyj poniższych instrukcji, aby ukryć lub pokazać kolumny.

  • Ukryj jedną kolumnę: kliknij ikonę Oka obok nazwy kolumny.
  • Ukryj wiele kolumn:
    • Zaznacz pola wyboru dla kolumn, które chcesz ukryć.
    • Z menu Akcje wybierz pozycję Ukryj wybrane kolumny.
  • Cofnij ukrycie: Powtórz te same kroki, aby ponownie wyświetlić ukrytą kolumnę.

Edytowanie metadanych kolumny

Dla każdej kolumny można dostosować następujące elementy:

  • Opis: opisy kolumn specyficzne dla danej przestrzeni, które poprawiają zrozumienie przez Genie.
  • Synonimy: terminy biznesowe i słowa kluczowe, które pomagają dopasować język użytkownika do nazw kolumn.
  • Ustawienia zaawansowane: kontrolki próbkowania wartości.
    • Przykładowe wartości: włącz lub wyłącz automatyczne próbkowanie reprezentatywnych wartości.
    • Twórz słownik wartości: włącz lub wyłącz słowniki wartości dla kolumn kategorycznych.

Aby edytować metadane kolumny:

  1. Kliknij ikonę Ołówek. Ikona ołówka obok nazwy kolumny.
  2. Edytuj opis i synonimy dla kolumny.
  3. W razie potrzeby kliknij pozycję Ustawienia zaawansowane , aby otworzyć kontrolki próbkowania wartości.
  4. Kliknij przycisk Zapisz , aby zachować zmiany i zamknąć okno dialogowe.

Omówienie próbkowania wartości

Próbkowanie wartości zwiększa zdolność Genie do zrozumienia twoich rzeczywistych danych i pracy z nimi dzięki zbieraniu reprezentatywnych przykładów.

Próbkowanie wartości poprawia generowanie SQL przez Genie, zapewniając dostęp do rzeczywistych wartości danych. Gdy użytkownicy zadają pytania konwersacyjne z błędami pisowni lub inną terminologią, próbkowanie wartości pomaga Genie dopasować zapytania do rzeczywistych wartości danych w tabelach.

Elementy próbkowania wartości

  • Przykładowe wartości: małe próbki z każdej kolumny, które pomagają Genie zrozumieć typy danych i formatowanie. Są one zbierane automatycznie dla wszystkich uprawnionych kolumn.
  • Słowniki wartości: Wyselekcjonowane listy zawierające maksymalnie 1024 odrębne wartości na kolumnę (mniej niż 127 znaków każdy). Przeznaczone dla maksymalnie 120 kolumn zawierających wartości tekstowe, które są kategoryczne lub jednolicie sformatowane, takie jak stany, kategorie produktów lub kody statusu.

Tabele z filtrami wierszy lub maskami kolumn są wykluczone z próbkowania wartości.

Zarządzanie próbkowaniem wartości

Kontroluj, które kolumny dostarczają przykładowych wartości i słowników wartości, aby zoptymalizować zrozumienie Twoich danych przez Genie. Próbkowanie wartości jest domyślnie włączone dla wszystkich przestrzeni Genie.

Zarządzanie przykładowymi wartościami

Przykładowe wartości są automatycznie dodawane podczas dodawania tabel do obszaru Genie.

Aby wyłączyć przykładowe wartości dla kolumny:

  1. Kliknij Konfiguruj > dane w obszarze Genie.
  2. Kliknij nazwę tabeli, aby wyświetlić jej kolumny.
  3. Kliknij ikonę Ołówek. Ikona ołówka obok nazwy kolumny.
  4. Kliknij Zaawansowane.
  5. Wyłącz opcję Przykładowe wartości .

Ta akcja powoduje automatyczne wyłączenie tworzenia słownika wartości dla tej kolumny. Jeśli to konieczne, użyj tego ustawienia, aby włączyć opcję Przykładowe wartości .

Konfigurowanie słowników wartości

Genie automatycznie wybiera kolumny do próbkowania wartości podczas dodawania danych do przestrzeni. Możesz ręcznie zarządzać kolumnami z włączonymi słownikami wartości. Wybierz kolumny ciągów z wartościami kategorii lub ustrukturyzowanymi, aby uzyskać najlepsze wyniki. Unikaj kolumn wolnego tekstu, takich jak identyfikatory użytkowników, nazwy lub przeglądy użytkowników.

Usługa Genie uniemożliwia włączanie słowników wartości w tabelach z filtrami wierszy lub maskami kolumn. Jednak autorzy przestrzeni muszą wyłączyć słowniki wartości dla widoków odwołujących się do tabel z filtrami wierszy lub maskami kolumn lub widokami dynamicznymi.

Poniższa lista zawiera przykłady typów danych, które działają dobrze z słownikami wartości:

  • Kody stanów lub krajów
  • Kategorie produktów
  • Kody stanu
  • Nazwy działów

Aby włączyć słownik wartości:

  1. Kliknij ikonę Ołówek. Ikona ołówka obok nazwy kolumny.
  2. Kliknij Zaawansowane.
  3. Włącz słownik wartości budowania .

Kolumna typu ciąg znaków z przyciskiem słownika wartości po prawej stronie.

Odświeżanie przykładowych wartości

Odświeżanie przykładowych wartości ponownie przeszukuje dane i zbiera nowe wartości, takie jak przykładowe wartości i słowniki wartości.

W następujących przypadkach należy odświeżyć przykładowe wartości:

  • Nowe wartości zostały dodane do kolumny
  • Format istniejących wartości został zmieniony

Aby zaktualizować przechowywane wartości:

  1. Kliknij ikonę menu Kebab. menu kebab w widoku kolumny
  2. Wybierz Odśwież przykładowe wartości

Odśwież wartości lub usuń opcje wartości w interfejsie użytkownika

Definiowanie relacji sprzężenia

Pomóż Genie utworzyć dokładne JOIN instrukcje, definiując relacje tabel.

  1. Kliknij pozycję Połączenia.
  2. Kliknij przycisk Dodaj.
  3. Z menu rozwijanych wybierz tabele po lewej i prawej stronie.
  4. Wprowadź warunek sprzężenia (na przykład accounts.id = opportunity.accountid)
    • (Opcjonalnie) W przypadku bardziej skomplikowanych warunków sprzężenia użyj wyrażenia SQL. Kliknij pozycję Użyj wyrażenia SQL, a następnie zapisz warunek sprzężenia jako wyrażenie SQL.
  5. Wybierz typ relacji:
    • Wiele do jednego: wiele wierszy po lewej stronie jest mapowane na jeden wiersz z prawej
    • Jeden do wielu: jeden wiersz po lewej stronie mapuje wiele wierszy w prawo
    • Jeden do jednego: Jeden lewy wiersz jest mapowany na co najwyżej jeden prawy wiersz

Instrukcje łączenia przedstawiające jedną zidentyfikowaną relację łączenia

Uwaga / Notatka

Gdy istnieje wiele sprzężeń między tymi samymi tabelami lub sprzężeniami własnymi, usługa Genie automatycznie generuje aliasy dla tabeli po prawej stronie, aby uniknąć niejednoznaczności.

Uzyskiwanie sugestii od opinii

Gdy użytkownicy klikają kciuki w górę w komunikacie, który łączy tabele lub używa wyrażeń SQL, Genie analizuje odpowiedź i może sugerować nowe fragmenty kodu SQL (takie jak miary, sprzężenia lub filtry) dla autorów przestrzeni w celu przejrzenia i dodania ich do magazynu wiedzy. Genie nie uczy się automatycznie ani nie zmienia swojego zachowania na podstawie otrzymanych opinii.

Definiowanie wyrażeń SQL

Interfejs wyrażeń SQL przedstawiający miary, filtry i wymiary

Wyrażenia SQL zapewniają ustrukturyzowany, kierowany sposób nauczania Genie o typowych terminach biznesowych, takich jak kluczowe wskaźniki wydajności, atrybuty i warunki. Genie może następnie użyć każdej z tych szczegółowych definicji, gdy użytkownik zapyta o nie.

Wyrażenia SQL uzupełniają przykładowe zapytania SQL określone w instrukcjach. Podczas gdy wyrażenia SQL definiują wielokrotnego użytku pojęcia biznesowe, przykładowe zapytania SQL są bardziej przydatne do nauczania Genie, jak podejść do typowych formatów zapytań użytkownika. Jeśli na przykład użytkownicy często pytają o "podział wydajności", przykładowe zapytanie SQL może pokazać, że oznacza to zamkniętą sprzedaż według regionu, przedstawiciela ds. sprzedaży i menedżera.

Wyrażenia SQL działają najlepiej, gdy zachodzi potrzeba:

  • Podaj definicje ustrukturyzowane dla wskaźników KPI i metryk, takich jak marża zysku lub współczynnik konwersji
  • Nadaj genie jawny kontekst na temat sposobu obliczania ważnych wartości
  • Definiowanie dodatkowych wymiarów zestawu danych, takich jak miesiąc lub segment klienta
  • Konfigurowanie filtrów Genie pod kątem warunków biznesowych, takich jak duże zamówienia lub zamówienia przed określonym czasem

Typy wyrażeń SQL

Można zdefiniować następujące typy wyrażeń SQL:

  • Miary: kluczowe wskaźniki wydajności (KPI) i metryki. Zdefiniuj nazwę, obliczenia SQL i synonimy.
  • Filtry: typowe warunki filtrowania. Zdefiniuj nazwę, logikę filtru SQL i synonimy.
  • Wymiary: atrybuty do grupowania i analizowania danych. Zdefiniuj nazwę, wyrażenie SQL i synonimy.

Aby zdefiniować wyrażenia SQL, wykonaj następujące instrukcje:

  1. Kliknij Konfiguruj>Instrukcje>Wyrażenia SQL
  2. Kliknij przycisk Dodaj. Wybierz pozycję Filtr, Miara lub Wymiar.
  3. W polu Nazwa wprowadź nazwę wyrażenia.
  4. W polu Kod wprowadź wyrażenie SQL.
  • Wyrażenia filtru powinny mieć wartość warunkową.
  • Wyrażenia miar powinny obliczać agregację dla wielu wierszy w tabeli.
  • Wyrażenia wymiarów powinny zmieniać wartość każdego wiersza z istniejących danych.
  1. W polu Synonimy wprowadź typowe sposoby, które użytkownicy mogą odwoływać się do wyrażeń potocznie.
  2. W polu Instrukcje wprowadź konkretne instrukcje , które informują Genie o tym, jakie jest wyrażenie i jak z nim pracować.

Dalsze kroki

Skorzystaj z poniższych łączy, aby pomóc w dalszym rozwijaniu przestrzeni Genie.