Udostępnij przez


Funkcje usługi Azure AI Search

Usługa Azure AI Search udostępnia pobieranie informacji i używa opcjonalnej integracji sztucznej inteligencji w celu wyodrębnienia większej wartości z zawartości tekstowej i wektorowej.

Poniższa tabela zawiera podsumowanie funkcji według kategorii. Istnieje parzystość funkcji we wszystkich chmurach publicznych, prywatnych i suwerennych platformy Azure, ale niektóre funkcje nie są obsługiwane w określonych regionach ani określonych warstwach.

Note

Szukasz funkcji w wersji zapoznawczej? Zobacz listę funkcji w wersji zapoznawczej.

Indeksowanie i wyodrębnianie danych

Category Features
Źródła danych Indeksy wyszukiwania mogą akceptować tekst z dowolnego źródła, pod warunkiem że są przesyłane jako dokument JSON.

Indeksatory to funkcja automatyzująca importowanie danych z obsługiwanych źródeł danych w celu wyodrębniania zawartości z możliwością wyszukiwania w podstawowych magazynach danych. Indeksatory obsługują serializacji JSON dla Ciebie i większość obsługuje jakąś formę wykrywania zmian i usuwania. Możesz nawiązać połączenie z różnymi źródłami danych, takimi jak Microsoft OneLake, Azure SQL Database, Azure Cosmos DB lub Azure Blob Storage.

Łączniki usługi Logic Apps (wersja zapoznawcza) zapewniają dostęp do szerszego zakresu źródeł danych, w tym danych na innych platformach w chmurze. Ten potok indeksowania i wzbogacania jest tworzony w usłudze Azure AI Search, ale zarządzany w usłudze Azure Logic Apps.
Hierarchiczne i zagnieżdżone struktury danych Złożone typy i kolekcje umożliwiają modelowanie praktycznie dowolnego typu struktury JSON w indeksie wyszukiwania. Kardynalność "jeden do wielu" i "wiele do wielu" może być wyrażana natywnie za pośrednictwem kolekcji, typów złożonych i kolekcji typów złożonych.
Analiza lingwistyczna Analizatory to składniki używane do przetwarzania tekstu podczas operacji indeksowania i wyszukiwania. Domyślnie można użyć analizatora Standard Lucene ogólnego przeznaczenia lub zastąpić wartość domyślną analizatorem języka, analizatorem niestandardowym skonfigurowanym lub innym wstępnie zdefiniowanym analizatorem tworzącym tokeny w wymaganym formacie.

Analizatory języków z Lucene lub Microsoft są używane do inteligentnej obsługi języków specyficznych dla języka, w tym czasowników, płci, nieregularnych rzeczowników mnogich (na przykład "myszy" a "myszy"), dekompilowania wyrazów, łamania wyrazów (w przypadku języków bez spacji) i nie tylko.

Niestandardowe analizatory leksykalne są używane do złożonych formularzy zapytań, takich jak dopasowywanie fonetyczne i wyrażenia regularne.

Integracja modelu czatu i agenta

Category Features
Modele uzupełniania czatu używane podczas indeksowania Umiejętność monitowania genAI (wersja zapoznawcza) to umiejętność , która wywołuje duży model językowy podczas indeksowania i wyświetla monit, który określa zadanie. Decydujesz, czym jest zadanie. Może on opisywać obraz, podsumowywanie lub manipulowanie zawartością albo dowolne zadanie, które może wykonać model. Dane wyjściowe są dodawane jako nowe pole w indeksie z możliwością wyszukiwania.
Modele uzupełniania czatu używane w czasie wykonywania zapytania Pobieranie agentów (wersja zapoznawcza) używa dużego modelu językowego do planowania zapytań, dekompozycji i parafrasowania złożonych zapytań w celu lepszego pokrycia zapytań względem indeksu. Odpowiedzi z pobierania agenta są przeznaczone dla przepływów pracy typu agent-agent. Wyniki wyszukiwania można przekazać jako pojedynczy duży ciąg, co upraszcza użycie agenta własnościowej zawartości. Odpowiedź zawiera również cytaty i informacje o wykonywaniu zapytań.

Wzorce RAG można zaimplementować przy użyciu istniejących możliwości. Możliwość dostosowywania pod kątem istotności i konstruowania zapytań hybrydowych zwiększa jakość zawartości wysyłanej do czatbotów na potrzeby generowania odpowiedzi.

Zastosowana sztuczna inteligencja i wzbogacona zawartość sztucznej inteligencji

Category Features
Przetwarzanie sztucznej inteligencji podczas indeksowania Wzbogacanie sztucznej inteligencji odnosi się do osadzonego obrazu i przetwarzania języka naturalnego w potoku indeksatora, który wyodrębnia tekst i informacje z zawartości, która nie może być indeksowana w celu wyszukiwania pełnotekstowego. Przetwarzanie sztucznej inteligencji jest osiągane przez dodawanie i łączenie umiejętności w zestawie umiejętności, które następnie jest dołączone do indeksatora. Sztuczna inteligencja może być wbudowanymi umiejętnościami firmy Microsoft, takimi jak tłumaczenie tekstu lub optyczne rozpoznawanie znaków (OCR) lub umiejętności niestandardowe .

Zintegrowane fragmentowanie i wektoryzacja danych dzieli większe fragmenty na mniejsze fragmenty, które można wektoryzować, z wektorami kierowanymi do dedykowanych pól w indeksie na potrzeby wyszukiwania wektorowego i hybrydowego.
Przetwarzanie sztucznej inteligencji podczas wykonywania zapytania Wektoryzatory służą do kodowania ciągów zapytań użytkownika do wektorów wyszukiwania wektorów. W przypadku zapytań używanych do indeksowania można użyć tych samych modeli osadzania.

Przechowywanie wzbogaconej zawartości na potrzeby analizy i użycia w scenariuszach niezwiązanych z wyszukiwaniem Magazyn wiedzy jest trwałym magazynem wzbogaconej przez sztuczną inteligencję lub wygenerowaną przez sztuczną inteligencję zawartości przeznaczoną dla scenariuszy niezwiązanych z wyszukiwaniem, takimi jak wyszukiwanie wiedzy i obciążenia nauki o danych. Magazyn wiedzy jest definiowany w zestawie umiejętności, ale utworzony w usłudze Azure Storage jako obiekty lub zestawy wierszy tabelarycznych.
Buforowane wzbogacania Buforowanie wzbogacania (wersja zapoznawcza) odnosi się do buforowanych wzbogaceń, które mogą być ponownie używane podczas wykonywania zestawu umiejętności. Buforowanie jest cenne w zestawach umiejętności, które obejmują OCR i analizę obrazów, które są kosztowne do przetworzenia.

Wektor i pobieranie hybrydowe

Category Features
Indeksowanie wektorów W indeksie wyszukiwania dodaj pola wektorów, aby obsługiwać scenariusze wyszukiwania wektorów. Pola wektorowe mogą współistnieć z polami niewektorowymi w tym samym dokumencie wyszukiwania.
Zapytania wektorowe Sformułuj zapytania pojedyncze i wiele wektorów.
Algorytmy wyszukiwania wektorowego Użyj hierarchicznego nawigowalnego małego świata (HNSW) lub wyczerpującego K najbliższych sąsiadów (KNN), aby znaleźć podobne wektory w indeksie wyszukiwania.
Filtry wektorowe Zastosuj filtry przed wykonaniem zapytania lub po nim, aby uzyskać większą precyzję podczas pobierania informacji.
Pobieranie informacji hybrydowych Wyszukaj pojęcia i słowa kluczowe w pojedynczym żądaniu zapytania hybrydowego.

Wyszukiwanie hybrydowe konsoliduje wyszukiwanie wektorowe i tekstowe z opcjonalnym semantycznym klasyfikowaniem i dostrajaniem istotności w celu uzyskania najlepszych wyników.
Zintegrowane fragmentowanie i wektoryzacja danych Natywne dzielenie danych za pomocą umiejętności dzielenia tekstu. Wektoryzacja natywna za pomocą wektoryzatorów i umiejętności w zakresie osadzania, takich jak osadzanie w usłudze Azure OpenAI, multimodalne funkcje Azure Vision i AML, których można użyć do łączenia się z punktami końcowymi w katalogu modeli Microsoft Foundry.

Zintegrowana wektoryzacja zapewnia pełny potok indeksowania z plików źródłowych do zapytań.
Kompresja i kwantyzacja wektorów zintegrowanych Użyj wbudowanej kwantyzacji skalarnej i binarnej, aby zmniejszyć rozmiar indeksu wektorowego w pamięci i na dysku. Można również zera przechowywać wektory, których nie potrzebujesz, lub przypisywać wąskie typy danych do pól wektorowych w celu uzyskania ograniczonych wymagań dotyczących magazynu.

Pełny tekst i inne formularze zapytania

Category Features
Wyszukiwanie tekstowe w dowolnej postaci Wyszukiwanie pełnotekstowe to podstawowy przypadek użycia większości aplikacji opartych na wyszukiwaniu. Zapytania można formułować za pomocą obsługiwanej składni.

Prosta składnia zapytania udostępnia operatory logiczne, operatory wyszukiwania fraz, operatory sufiksów, operatory pierwszeństwa.

Pełna składnia zapytań Lucene obejmuje wszystkie operacje w prostej składni, z rozszerzeniami wyszukiwania rozmytego, wyszukiwania w pobliżu, zwiększania terminów i wyrażeń regularnych.
Relevance Proste ocenianie to kluczowa zaleta usługi Azure AI Search. Profile oceniania służą do modelowania trafności jako funkcji wartości w samych dokumentach. Na przykład nowsze produkty lub produkty o obniżonej cenie mogą być wyświetlane na początku wyników wyszukiwania. Do tworzenia profilów oceniania można również używać tagów spersonalizowanej oceny opartych na preferencjach klientów, śledzonych i przechowywanych oddzielnie.

Semantyczny ranger to funkcja premium, która reranksuje wyniki na podstawie semantycznego istotności zapytania. W zależności od zawartości i scenariusza może znacznie poprawić istotność wyszukiwania przy prawie minimalnej konfiguracji lub nakładu pracy.
Wyszukiwanie geoprzestrzenne Funkcje geoprzestrzenne filtrują i pasują do współrzędnych geograficznych. Można dopasować na odległość lub poprzez włączenie w kształcie wielokąta.
Filtry i aspekty Nawigacja aspektowa jest włączana za pomocą jednego parametru zapytania. Usługa Azure AI Search zwraca strukturę nawigacji aspektowej, której można użyć jako kodu listy kategorii do samodzielnego filtrowania (na przykład filtrowania elementów wykazu według zakresu cen lub marki).

Filtry mogą służyć do dołączania nawigacji aspektowej do interfejsu użytkownika aplikacji, ulepszania formuł zapytań i filtrowania na podstawie kryteriów określonych przez użytkownika lub dewelopera. Do tworzenie filtrów służy składnia OData.
Doświadczenie użytkownika Autouzupełnianie można włączyć dla zapytań z wyprzedzeniem typu na pasku wyszukiwania.

Sugestie wyszukiwania działają również poza częściowymi danymi wejściowymi tekstowymi na pasku wyszukiwania, ale wyniki są rzeczywistymi dokumentami w indeksie, a nie terminami zapytania.

Synonimy kojarzy równoważne terminy , które niejawnie rozszerzają zakres zapytania, bez konieczności podawania terminów alternatywnych przez użytkownika.

Wyróżnianie trafień stosuje formatowanie tekstu do pasującego słowa kluczowego w wynikach wyszukiwania. Możesz wybrać pola, które zwracają wyróżnione fragmenty kodu.

Sortowanie jest oferowane dla wielu pól za pośrednictwem schematu indeksu, a następnie przełączane w czasie zapytania za pomocą jednego parametru wyszukiwania.

Stronicowanie i ograniczanie wyników wyszukiwania jest proste dzięki precyzyjnej kontroli, którą usługa Azure AI Search oferuje w wynikach wyszukiwania.

Funkcje zabezpieczeń

Category Features
Bezpieczeństwo sieci Reguły adresów IP dla obsługi zapory dla ruchu przychodzącego umożliwiają konfigurowanie zakresów adresów IP, dla których usługa wyszukiwania akceptuje żądania.

Utwórz prywatny punkt końcowy przy użyciu usługi Azure Private Link, aby wymusić wszystkie żądania za pośrednictwem sieci wirtualnej.

Obsługa obwodu zabezpieczeń sieci umożliwia dołączenie usługi Azure AI Search do obwodu zabezpieczeń sieci, który obejmuje inne zasoby platformy Azure, dzięki czemu można zarządzać dostępem do sieci holistycznym.
Szyfrowanie danych Szyfrowanie zarządzane przez firmę Microsoft jest wbudowane w wewnętrzną warstwę magazynu i jest nieodwracalne.

Klucze szyfrowania zarządzane przez klienta (CMK) tworzone i zarządzane w usłudze Azure Key Vault mogą służyć do dodatkowego szyfrowania indeksów i map synonimów. W przypadku usług utworzonych po 1 sierpnia 2020 r. szyfrowanie CMK rozszerza dane na dyskach tymczasowych w celu pełnego podwójnego szyfrowania indeksowanej zawartości.
Dostęp przychodzący Kontrola dostępu oparta na rolach przypisuje role użytkownikom i grupom w usłudze Microsoft Entra ID w celu uzyskania kontrolowanego dostępu do zawartości i operacji wyszukiwania. Możesz również użyć uwierzytelniania opartego na kluczach, jeśli nie chcesz używać przypisań ról.

Kontrola dostępu na poziomie dokumentu (wersja zapoznawcza) filtruje wyniki wyszukiwania, których użytkownik nie ma uprawnień do wyświetlania. W przypadku kilku źródeł danych, jeśli źródło danych zapewnia model kontroli dostępu, można skonfigurować indeks, aby dziedziczył metadane uprawnień użytkownika.
Zabezpieczenia dla ruchu wychodzącego (indeksatory) Połączenia danych za pośrednictwem prywatnych punktów końcowych umożliwiają indeksatorowi łączenie się z zasobami platformy Azure chronionymi za pośrednictwem usługi Azure Private Link.

Połączenia danych za pośrednictwem tożsamości zarządzanych uwierzytelniają połączenia z zasobami platformy Azure przy użyciu podmiotu zabezpieczeń firmy Microsoft Entra, co eliminuje przechowywanie i przekazywanie zakodowanych na stałe kluczy interfejsu API.

Dostęp do danych przy użyciu zaufanej tożsamości oznacza, że parametry połączenia z zewnętrznymi źródłami danych mogą pomijać nazwy użytkowników i hasła. Gdy indeksator łączy się ze źródłem danych, zasób zezwala na połączenie, jeśli usługa wyszukiwania została wcześniej zarejestrowana jako zaufana usługa (dotyczy tylko usługi Azure Storage).

Funkcje portalu

Category Features
Narzędzia służące do tworzenia prototypów i przeprowadzania inspekcji Dodawanie indeksu to projektant indeksu w witrynie Azure Portal, którego można użyć do utworzenia podstawowego schematu składającego się z pól przypisanych i kilku innych ustawień. Po zapisaniu indeksu możesz wypełnić go przy użyciu zestawu SDK lub interfejsu API REST w celu udostępnienia danych.

Kreator importu danych tworzy indeksy, indeksatory, zestawy umiejętności i definicje źródeł danych. Jeśli dane istnieją na platformie Azure, ten kreator może zaoszczędzić dużo czasu i nakładu pracy, szczególnie w przypadku badania i eksploracji weryfikacji koncepcji.

Kreator importu danych (nowy) tworzy pełny proces indeksowania, który obejmuje fragmentowanie i wektoryzację danych. Kreator tworzy wszystkie obiekty i ustawienia konfiguracji.

Eksplorator wyszukiwania służy do testowania zapytań i uściślinia profilów oceniania.

Tworzenie aplikacji demonstracyjnej służy do generowania strony HTML, która może służyć do testowania środowiska wyszukiwania.

Sesje debugowania to edytor wizualny, który umożliwia interaktywne debugowanie zestawu umiejętności. Pokazuje on zależności, dane wyjściowe i przekształcenia.
Monitorowanie i diagnostyka Włącz funkcje monitorowania, aby przejść poza metryki na pierwszy rzut oka, które są zawsze widoczne w witrynie Azure Portal. Metryki dotyczące zapytań na sekundę, opóźnienia i ograniczania są przechwytywane i zgłaszane na stronach portalu bez konieczności dodatkowej konfiguracji.

Programmability

Category Features
REST Interfejs API REST usługi jest przeznaczony dla operacji płaszczyzny danych, w tym wszystkich operacji związanych z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

Interfejs API REST zarządzania służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.
Zestaw Azure SDK dla platformy .NET Azure.Search.Documents to operacje płaszczyzny danych, w tym wszystkie operacje związane z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

Microsoft.Azure.Management.Search służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.
Zestaw Azure SDK dla języka Java Com.azure.search.documents jest przeznaczony dla operacji płaszczyzny danych, w tym wszystkich operacji związanych z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

Com.microsoft.azure.management.search służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.
Zestaw Azure SDK dla środowiska Python azure-search-documents to operacje płaszczyzny danych, w tym wszystkie operacje związane z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

azure-mgmt-search służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.
Zestaw Azure SDK dla języka JavaScript/TypeScript azure/search-documents to operacje płaszczyzny danych, w tym wszystkie operacje związane z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

usługa azure/arm-search służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.