Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ważne
Ta funkcja jest obecnie w publicznej wersji zapoznawczej. Ta wersja zapoznawcza jest udostępniana bez umowy dotyczącej poziomu usług i nie zalecamy korzystania z niej w przypadku obciążeń produkcyjnych. Niektóre funkcje mogą być nieobsługiwane lub ograniczone.
Aby uzyskać więcej informacji, zobacz Uzupełniające warunki korzystania z wersji zapoznawczych platformy Microsoft Azure.
W tym artykule opisano magazyny wektorów w usłudze Azure Machine Learning, których można użyć do wykonania generowania rozszerzonego pobierania (RAG). Magazyn wektorów zawiera osadzanie, które są liczbowymi reprezentacjami pojęć (danych) przekonwertowanych na sekwencje liczbowe. Osadzanie umożliwia korzystanie z dużych modeli językowych (LLM) w celu zrozumienia relacji między pojęciami. Możesz tworzyć magazyny wektorów, aby połączyć dane z modułami LLM, takimi jak GPT-4, i efektywnie pobierać dane.
Usługa Azure Machine Learning obsługuje dwa magazyny wektorów zawierające dane uzupełniające używane w przepływie pracy RAG:
| Magazyn wektorów | opis | Funkcje i użycie |
|---|---|---|
| Faiss | Biblioteka open source | — Używa lokalnego magazynu opartego na plikach - Wiąże się z minimalnymi kosztami — Obsługuje dane tylko wektorowe - Obsługuje programowanie i testowanie |
| Azure AI Search | Zasób usługi Azure PaaS | — Przechowuje dane tekstowe w indeksach wyszukiwania — Hostuje dużą liczbę indeksów z jedną usługą — Obsługuje wymagania biznesowe na poziomie przedsiębiorstwa — Zapewnia pobieranie informacji hybrydowych |
W poniższych sekcjach opisano zagadnienia dotyczące pracy z tymi magazynami wektorów.
Biblioteka Faiss
Faiss to biblioteka typu open source, która udostępnia lokalny magazyn oparty na plikach. Indeks wektorowy jest przechowywany na koncie usługi Azure Storage obszaru roboczego usługi Azure Machine Learning. Aby pracować z aplikacją Faiss, pobierz bibliotekę i użyj jej jako składnika rozwiązania. Ponieważ indeks jest przechowywany lokalnie, koszty są minimalne.
Bibliotekę Faiss można użyć jako magazynu wektorów, aby wykonać następujące akcje:
Lokalne przechowywanie danych wektorowych bez kosztów tworzenia indeksu (mają zastosowanie tylko koszty magazynowania)
Kompilowanie i wykonywanie zapytań względem indeksu w pamięci
Udostępnianie kopii do użytku indywidualnego i konfigurowanie hostowania indeksu dla aplikacji
Skalowanie przy użyciu bazowych zasobów obliczeniowych podczas ładowania indeksu
Wyszukiwanie AI platformy Azure
Azure AI Search to dedykowany zasób PaaS platformy Azure tworzony w ramach subskrypcji platformy Azure. Zasób obsługuje pobieranie informacji na wektor i dane tekstowe przechowywane w indeksach wyszukiwania. Przepływ monitu może tworzyć, wypełniać i wykonywać zapytania dotyczące danych wektorowych przechowywanych w usłudze Azure AI Search. Pojedyncza usługa wyszukiwania może hostować wiele indeksów, które mogą być odpytywane i używane we wzorcu RAG.
Poniżej przedstawiono kluczowe kwestie dotyczące korzystania z usługi Azure AI Search dla magazynu wektorów:
Obsługuje wymagania biznesowe na poziomie przedsiębiorstwa dotyczące skalowania, zabezpieczeń i dostępności.
Udostępnia pobieranie informacji hybrydowych. Dane wektorowe mogą współistnieć z danymi niewektorowymi, co oznacza, że można użyć dowolnych funkcji usługi Azure AI Search na potrzeby indeksowania i zapytań, w tym wyszukiwania hybrydowego i semantycznego ponownego korbowania.
Obsługa wektorów jest dostępna w wersji zapoznawczej. Obecnie wektory muszą być generowane zewnętrznie, a następnie przekazywane do usługi Azure AI Search na potrzeby indeksowania i kodowania zapytań. Przepływ monitu obsługuje te przejścia.
Aby użyć usługi Azure AI Search jako magazynu wektorów dla usługi Azure Machine Learning, musisz mieć usługę wyszukiwania. Po utworzeniu usługi i udzieleniu dostępu deweloperom możesz wybrać usługę Azure AI Search jako indeks wektorowy w przepływie monitu. Przepływ monitu tworzy indeks w usłudze Azure AI Search, generuje wektory na podstawie danych źródłowych, wysyła wektory do indeksu, wywołuje wyszukiwanie podobieństw w usłudze Azure AI Search i zwraca odpowiedź.