Udostępnij przez


Co to jest źródło wiedzy?

Uwaga / Notatka

Ta funkcja jest obecnie w publicznej wersji zapoznawczej. Ta wersja zapoznawcza jest udostępniana bez umowy dotyczącej poziomu usług i nie jest zalecana w przypadku obciążeń produkcyjnych. Niektóre funkcje mogą nie być obsługiwane lub mogą mieć ograniczone możliwości. Aby uzyskać więcej informacji, zobacz Warunki dodatkowe korzystania z testowych wersji Microsoft Azure.

Źródło wiedzy określa zawartość używaną do odtwarzania agentowego. Hermetyzuje indeks wyszukiwania wypełniany przez zewnętrzne źródło danych lub zapewnia bezpośrednie połączenie ze zdalnym źródłem, takim jak Bing lub SharePoint, które można bezpośrednio odpytywać. Źródło wiedzy jest wymaganą definicją w bazie wiedzy.

  • Utwórz źródło wiedzy jako zasób najwyższego poziomu w usłudze wyszukiwania. Każde źródło wiedzy wskazuje dokładnie jedną strukturę danych — indeks wyszukiwania spełniający kryteria agentowego pobierania lub obsługiwany zasób zewnętrzny.

  • Odwołuj się do co najmniej jednego źródła wiedzy w bazie wiedzy. W agentowym potoku pobierania można wykonywać zapytania względem wielu źródeł wiedzy w jednym żądaniu. Podzapytania są generowane dla każdego źródła wiedzy. Pierwsze wyniki są zwracane w odpowiedzi pobierania.

  • W przypadku niektórych źródeł wiedzy możesz użyć definicji źródła wiedzy, aby wygenerować pełny potok indeksowania (źródło danych, zestaw umiejętności, indeksator i indeks), który działa na potrzeby pobierania agentowego. Zamiast ręcznie tworzyć wiele obiektów, informacje w źródle wiedzy są używane do generowania wszystkich obiektów, w tym wypełnionego, fragmentowanego i przeszukiwalnego indeksu.

Przed utworzeniem bazy wiedzy upewnij się, że masz co najmniej jedno źródło wiedzy. Pełną specyfikację źródła wiedzy i bazy wiedzy można znaleźć w dokumentacji interfejsu API REST w wersji zapoznawczej.

Praca ze źródłem wiedzy

  • Ścieżka tworzenia: najpierw utwórz źródło wiedzy, a następnie utwórz bazę wiedzy.

  • Ścieżka usuwania: aktualizowanie lub usuwanie baz wiedzy w celu usunięcia odwołań do źródła wiedzy, a następnie ostatniego usunięcia źródła wiedzy.

  • Źródło wiedzy, jego indeks i baza wiedzy muszą istnieć w tej samej usłudze wyszukiwania. Dostęp do zawartości zewnętrznej jest uzyskiwany za pośrednictwem publicznego Internetu (Bing) lub w dzierżawie firmy Microsoft (zdalny program SharePoint).

Obsługiwane źródła wiedzy

Oto źródła wiedzy, które można utworzyć w tej wersji zapoznawczej:

Rodzaj Indeksowane lub zdalne
"searchIndex" Interfejs API opakowuje istniejący indeks. Indeksowane
"azureBlob" Interfejs API generuje pipeline indeksowania, który pobiera dane z kontenera blob. Indeksowane
"indexedOneLake" Interfejs API generuje kanał indeksowania, który ściąga dane z lakehouse. Indeksowane
"indexedSharePoint" Interfejs API generuje potok indeksatora, który ściąga z witryny programu SharePoint. Indeksowane
"remoteSharePoint" Interfejs API pobiera zawartość bezpośrednio z programu SharePoint. Remote
"webParameters" Interfejs API pobiera dane podstawowe w czasie rzeczywistym z Microsoft Bing. Remote

Indeksowane źródła wiedzy kierują na indeks docelowy w Azure AI Search, a zapytania są wykonywane lokalnie przez aparat wyszukiwania w Twojej usłudze wyszukiwania. Funkcje wyszukiwania słów kluczowych (wyszukiwania pełnotekstowego), wektora i zapytania hybrydowego są używane do pobierania danych ze indeksowanych źródeł wiedzy.

Dostęp do zdalnych źródeł wiedzy jest uzyskiwany w czasie wykonywania zapytań. Engine agenta odzyskiwania wywołuje natywne dla platformy API odzyskiwania (Bing lub SharePoint API).

Cała pobrana zawartość, niezależnie od tego, czy indeksowana, czy zdalna, jest pobierana do potoku klasyfikacji w usłudze Azure AI Search, gdzie jest oceniana pod kątem istotności, scalona (przy założeniu wielu zapytań), ponownie sklasyfikowana i zwrócona w odpowiedzi pobierania.

Tworzenie źródeł wiedzy

Źródła wiedzy są tworzone jako obiekty autonomiczne, a następnie określone w bazie wiedzy w tablicy "knowledgeSources".

Aby tworzyć obiekty w usłudze wyszukiwania, musisz mieć uprawnienia Współautor usługi wyszukiwania. Potrzebujesz również uprawnień Kontrybutora danych indeksu wyszukiwania, aby wczytać indeks, jeżeli korzystasz ze źródła wiedzy, które tworzy potok indeksowania. Alternatywnie możesz użyć klucza administratora interfejsu API zamiast ról.

Aby utworzyć źródło wiedzy, możesz użyć interfejsu API REST lub pakietu wersji zapoznawczej zestawu Azure SDK. Obsługa witryny Azure Portal jest dostępna dla wybranych źródeł wiedzy. Poniższe linki zawierają instrukcje dotyczące tworzenia źródła wiedzy:

Po utworzeniu źródła wiedzy można odwoływać się do niego w bazie wiedzy.

Korzystanie ze źródeł wiedzy

Użycie źródła wiedzy jest albo kontrolowane w sposób jawny, na przykład poprzez ustawienie alwaysQuery w definicji źródła wiedzy, albo podlega logice wyboru podczas planowania zapytania. Planowanie zapytań odbywa się w przypadku korzystania z niskiego lub średniego nakładu na wyszukiwanie i wnioskowanie. Ze względu na minimalny wysiłek rozumowania, wszystkie źródła wiedzy wymienione w bazie wiedzy są brane pod uwagę dla każdego z zapytań. W przypadku niskiego i średniego poziomu baza wiedzy i LLM mogą określić podczas zapytania, które źródła wiedzy prawdopodobnie zapewnią najlepszy zbiór danych wyszukiwania.

Logika wyboru źródła wiedzy jest oparta na następujących czynnikach:

  • Czy ustawiono alwaysQuery ? Jeśli tak, źródło wiedzy jest zawsze używane w każdym zapytaniu.

  • Źródło name wiedzy.

  • Indeks description przy założeniu indeksowanego źródła wiedzy.

  • Określony retrievalInstructions w akcji pobierania lub w definicji bazy wiedzy zawiera wskazówki, które obejmują lub wykluczają źródło wiedzy. Jest on podobny do monitu. Możesz określić zwięzłość, ton i formatowanie jako instrukcję pobierania.

  • outputMode w bazie wiedzy wpływa również na wyniki zapytania i na to, co znajduje się w odpowiedzi.

Użycie wnioskowania związanego z pobieraniem w celu kontrolowania użycia LLM

Nie wszystkie rozwiązania korzystają z planowania i wykonywania zapytań LLM. Jeśli prostota i szybkość przewyższają korzyści zapewniane przez planowanie zapytań LLM i inżynierię kontekstu, możesz określić minimalny wysiłek w rozumowaniu, aby ograniczyć przetwarzanie LLM w potoku.

W przypadku niskiego i średniego poziomu przetwarzanie LLM odbywa się według zrównoważonego lub maksymalnego podejścia, które poprawia istotność. Aby uzyskać więcej informacji, należy zapoznać się z Ustawianie logiki pobierania.

Uwaga / Notatka

Jeśli w poprzedniej wersji zapoznawczej użyto attemptFastPath, to podejście zostało teraz zastąpione przez retrievalReasoningEffort ustawione na minimal.