Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Azure KI-Suche bietet Informationsabruf und verwendet eine optionale KI-Integration, um mehr Wert aus Text- und Vektorinhalten zu extrahieren.
In der folgenden Tabelle sind die Features nach Kategorie zusammengefasst. In allen öffentlichen, privaten und souveränen Clouds von Azure gibt es Featureparität, aber einige Features werden in bestimmten Regionen oder bestimmten Tarifen nicht unterstützt.
Note
Sie suchen nach Previewfunktionen? Sehen Sie sich die Liste der Vorschaufeatures an.
Indizierung und Datenextraktion
| Category | Features |
|---|---|
| Datenquellen | Search-Indizes können Daten aus beliebigen Quellen akzeptieren, sofern sie als JSON-Dokument übermittelt werden.
Indexer sind ein Feature, das den Datenimport aus unterstützten Datenquellen automatisiert, um durchsuchbare Inhalte in primären Datenspeichern zu extrahieren. Indexer übernehmen die JSON-Serialisierung für Sie, und die meisten unterstützen bestimmte Formen der Änderungs- und Löschungserkennung. Sie können eine Verbindung mit einer Vielzahl von Datenquellen herstellen, einschließlich Microsoft OneLake, Azure SQL-Datenbank, Azure Cosmos DB oder Azure Blob Storage. Logic Apps Connectors (Vorschau) bieten Ihnen Zugriff auf eine breitere Palette von Datenquellen, einschließlich Daten auf anderen Cloudplattformen. Diese Indizierungs- und Anreicherungspipeline wird in Azure KI-Suche erstellt, aber in Azure Logic Apps verwaltet. |
| Hierarchische und geschachtelte Datenstrukturen | Mit komplexen Typen und Sammlungen können Sie nahezu jede JSON-Struktur innerhalb eines Suchindex modellieren. Die Eins-zu-viele- und Viele-zu-viele-Kardinalität kann über Sammlungen, komplexe Typen und Sammlungen von komplexen Typen nativ ausgedrückt werden. |
| Linguistische Analyse | Analysemodule sind Komponenten, die für die Textverarbeitung während Indizierungs- und Suchvorgängen eingesetzt werden. Standardmäßig können Sie das universelle Lucene-Standardanalysetool verwenden oder den Standard mit einem Sprachanalysetool, einem benutzerdefinierten und von Ihnen konfigurierten Analysetool oder einem anderen vordefinierten Analysetool überschreiben, das Tokens im gewünschten Format generiert.
Sprachanalysen von Lucene oder Microsoft werden verwendet, um sprachspezifische Linguistik intelligent zu verarbeiten, einschließlich Verben, Geschlecht, Substantive mit unregelmäßigem Plural (z. B. „Maus“ und „Mäuse“), Zerlegung von Wörtern, Worttrennung (für Sprachen ohne Leerzeichen) und vieles mehr. Benutzerdefinierte lexikalische Analysetools werden für komplexe Abfrageformulare wie phonetische Abgleiche und reguläre Ausdrücke verwendet. |
Chatmodell- und Agent-Integration
| Category | Features |
|---|---|
| Während der Indizierung verwendete Modelle für die Chatvervollständigung | GenAI Prompt-Fähigkeit (Vorschau) ist eine Fähigkeit, die während der Indizierung ein Large Language Model aufruft und einen Prompt bereitstellt, der die Aufgabe bestimmt. Sie entscheiden, was die Aufgabe ist. Sie kann sein, ein Bild zu beschreiben, Inhalte zusammenzufassen oder zu bearbeiten, oder jede Aufgabe, die das Modell ausführen kann. Die Ausgabe wird als neues Feld in einem durchsuchbaren Index hinzugefügt. |
| Zur Abfragezeit verwendete Modelle für die Chatvervollständigung |
Agent-Abruf (Vorschau) verwendet ein Large Language Model für die Abfrageplanung, Zerlegung und Paraphrasierung komplexer Abfragen für eine bessere Abfrageabdeckung über Ihren Index. Antworten vom Agent-Abruf sind für Agent-zu-Agent-Workflows konzipiert. Sie können Suchergebnisse als einzelne große Zeichenfolge übergeben, wodurch der Agent-Verbrauch Ihrer proprietären Inhalte vereinfacht wird. Die Antwort enthält auch Zitate und Informationen zur Abfrageausführung.
RAG-Muster können mithilfe vorhandener Funktionen implementiert werden. Die Möglichkeit, die Relevanz zu optimieren und Hybridabfragen zu erstellen, verbessert die Qualität der Inhalte, die an Chat-Bots für die Antwortgenerierung gesendet werden. |
Angewendete KI und mit KI angereicherte Inhalte
| Category | Features |
|---|---|
| KI-Verarbeitung während der Indizierung | Die KI-Anreicherung bezieht sich auf die Verarbeitung eingebetteter Bilder und die natürliche Sprachverarbeitung in einer Indexerpipeline, die Text und Informationen aus Inhalten extrahiert, die andernfalls nicht für die Volltextsuche indiziert werden können. Die KI-Verarbeitung wird durch das Hinzufügen und Kombinieren von Fähigkeiten in einem Skillset erreicht, das dann an einen Indexer angeschlossen wird. Bei der KI kann es sich entweder um integrierte Fähigkeiten von Microsoft handeln, wie z. B. Textübersetzung oder optische Zeichenerkennung (OCR), oder um angepasste Fähigkeiten, die Sie bereitstellen. Integrierte Datenblöcke und Vektorisierung teilen größere Passagen in kleinere Abschnitte auf, die vektorisiert werden können, wobei Vektoren für die Vektor- und Hybridsuche an dedizierte Felder in einem Index weitergeleitet werden. |
| KI-Verarbeitung während der Abfrageausführung | Vektorisierer werden verwendet, um Benutzerabfragezeichenfolgen in Vektoren für die Vektorsuche zu codieren. Sie können dieselben Einbettungsmodelle für Abfragen verwenden, die Sie für die Indizierung verwendet haben. |
| Speichern von angereicherten Inhalten für die Analyse und Nutzung in Szenarien ohne Suche | Der Wissensspeicher ist ein persistenter Speicher von KI-Inhalten, die für Nicht-Suchszenarien wie Wissensgewinnungs- und Data Science-Workloads vorgesehen sind. Ein Wissensspeicher wird in einem Skillset definiert, aber in Azure Storage als Objekte oder tabellarische Rowsets erstellt. |
| Angereicherte Inhalte im Cache | Die Anreicherungszwischenspeicherung (Vorschau) bezieht sich auf zwischengespeicherte Anreicherungen, die während der Ausführung von Skillsets wiederverwendet werden können. Die Zwischenspeicherung ist in Skillsets hilfreich, die OCR und Bildanalysen umfassen, die aufwändig zu verarbeiten sind. |
Vektor- und Hybridabruf
| Category | Features |
|---|---|
| Vektorindizierung | Fügen Sie in einem Suchindex Vektorfelder hinzu, um Vektorsuchszenarien zu unterstützen. Vektorfelder können zusammen mit Nichtvektorfeldern im gleichen Suchdokument vorhanden sein. |
| Vektorabfragen | Formulieren sie einzelne und mehrere Vektorabfragen. |
| Vektorsuchalgorithmen | Verwenden Sie hierarchische Navigable Small World (HNSW) oder erschöpfende K-Nearest-Neighbors (KNN), um ähnliche Vektoren in einem Suchindex zu finden. |
| Vektorfilter | Anwenden von Filtern vor oder nach der Abfrageausführung für eine höhere Genauigkeit beim Abrufen von Informationen. |
| Abrufen von Hybridinformationen | Suchen Sie in einer einzigen Hybridabfrageanforderungnach Konzepten und Schlüsselwörtern. Die hybride Suche konsolidiert die Vektor- und Textsuche mit einer optionalen semantischen Bewertung und Relevanzoptimierung, um optimale Ergebnisse zu erzielen. |
| Integrierte Datensegmentierung und -vektorisierung | Systemeigene Datenabschnitte durch Textteilungsfertigkeit. Native Vektorisierung durch Vektorisierer und Einbettungsfertigkeiten wie Azure OpenAI Embedding, Azure Vision multimodal und AML , mit denen Sie eine Verbindung mit Endpunkten im Microsoft Foundry-Modellkatalog herstellen können. Die integrierte Vektorisierung stellt eine End-to-End-Indizierungspipeline von Quelldateien zu Abfragen bereit. |
| Integrierte Vektorkomprimierung und Quantisierung | Verwenden Sie die integrierte Skalar- und Binärquantisierung, um die Vektorindexgröße im Arbeitsspeicher und auf dem Datenträger zu reduzieren. Sie können auch auf die Speicherung von Vektoren, die Sie nicht benötigen, verzichten oder kleine Datentypen Vektorfeldern für geringere Speicheranforderungen zuweisen. |
Volltext und andere Abfrageformulare
| Category | Features |
|---|---|
| Freiform-Textsuche |
Die Volltextsuche ist ein primärer Anwendungsfall für die meisten suchbasierten Apps. Abfragen können mit einer unterstützten Syntax formuliert werden.
Einfache Abfragesyntax stellt logische Operatoren, Operatoren für die Suche von Ausdrücken, Suffixoperatoren und Rangfolgenoperatoren bereit. Vollständige Lucene-Abfragesyntax enthält alle Vorgänge in einfacher Syntax mit Erweiterungen für Fuzzysuche, Näherungssuche, Begriffsverstärkung und reguläre Ausdrücke. |
| Relevance |
Die einfache Bewertung ist ein zentraler Vorteil von Azure KI-Suche. Anhand von Bewertungsprofilen kann die Relevanz als Funktion der Werte in den Dokumenten selbst modelliert werden. Beispielsweise kann es wünschenswert sein, dass neuere Produkte oder herabgesetzte Produkte in den Suchergebnissen weiter oben angezeigt werden. Sie können Bewertungsprofile auch mithilfe von Tags für eine personalisierte Bewertung erstellen, die auf den Sucheinstellungen der Kunden basiert, die Sie nachverfolgt und separat gespeichert haben.
Beim Semantischen Sortierer handelt es sich um ein Premium-Feature, das die Ergebnisse auf der Grundlage der semantischen Relevanz der Abfrage neu ordnet. Je nach Inhalt und Szenario kann die Suchrelevanz mit nahezu minimalem Konfigurationsaufwand erheblich verbessert werden. |
| Geosuche | Geofunktionen filtern nach geografischen Koordinaten und stimmen mit ihnen überein. Sie können eine Übereinstimmung nach Entfernung oder durch Einschließen in eine Polygonform finden. |
| Filter und Facets |
Die Facettennavigation wird über einen einzigen Abfrageparameter aktiviert. Azure AI Search gibt eine Struktur für die Facettennavigation zurück, die Sie als Code hinter einer Kategorieliste für eine selbstgesteuerte Filterung nutzen können (z.B. um Katalogartikel nach Preisbereich oder Marke zu filtern).
Filter ermöglichen die Integration einer Facettennavigation in die Benutzeroberfläche Ihrer Anwendung, die Erweiterung von Abfrageformulierungen sowie die Filterung auf der Grundlage von Kriterien von Benutzern oder Entwicklern. Erstellen Sie Filter mithilfe der OData-Syntax. |
| Benutzerfreundlichkeit |
AutoVervollständigen kann für Abfragen mit Vorschlagssuche in einer Suchleiste aktiviert werden.
Suchvorschläge funktionieren auch mit Eingaben von Textteilen in eine Suchleiste, jedoch werden die Ergebnisse als tatsächliche Dokumente in Ihrem Index dargestellt und nicht als Abfragebegriffe. Synonyme ordnen entsprechende Begriffe zu, die den Bereich einer Abfrage implizit erweitern, ohne dass der Benutzer die alternativen Begriffe bereitstellen muss. Treffermarkierung wendet Textformatierung auf ein übereinstimmendes Schlüsselwort in Suchergebnissen an. Sie können auswählen, welche Felder hervorgehobene Ausschnitte zurückgeben. Das Sortieren wird für mehrere Felder über das Indexschema angeboten und dann zur Abfragezeit mit einem einzigen Suchparameter umgeschaltet. Paginieren und Einschränken Ihrer Suchergebnisse ist mit der fein abgestimmten Kontrolle, die Azure KI-Suche für Ihre Suchergebnisse bietet, einfach. |
Sicherheitsfeatures
| Category | Features |
|---|---|
| Netzwerksicherheit |
IP-Regeln für eingehende Firewallunterstützung ermöglichen Ihnen das Einrichten von IP-Adressbereichen, über die der Suchdienst Anforderungen akzeptiert.
Erstellen Sie einen privaten Endpunkt mithilfe von Azure Private Link, um alle Anforderungen über ein virtuelles Netzwerk zu erzwingen. Netzwerksicherheitsperimeter-Unterstützung ermöglicht es Ihnen, Azure KI-Suche einem Netzwerksicherheitsperimeter hinzuzufügen, der andere Azure-Ressourcen enthält, sodass Sie den Netzwerkzugriff ganzheitlicher verwalten können. |
| Datenverschlüsselung |
Die von Microsoft verwaltete Verschlüsselung ruhender Daten ist in der internen Speicherebene integriert und unwiderruflich.
Kundenseitig verwaltete Verschlüsselungsschlüssel (CMK), die Sie in Azure Key Vault erstellen und verwalten, können zur ergänzenden Verschlüsselung von Indizes und Synonymzuordnungen verwendet werden. Bei Diensten, die nach dem 1. August 2020 erstellt wurden, erstreckt sich die CMK-Verschlüsselung auch auf Daten auf temporären Datenträgern, um eine vollständige doppelte Verschlüsselung der indexierten Inhalte zu erreichen. |
| Eingehender Zugriff |
Die rollenbasierte Zugriffssteuerung weist Benutzern und Gruppen in Microsoft Entra ID Rollen zu, um den kontrollierten Zugriff auf Suchinhalte und -vorgänge zu ermöglichen. Sie können auch eine schlüsselbasierte Authentifizierung verwenden, wenn Sie keine Rollenzuweisungen nutzen möchten.
Zugriffssteuerung auf Dokumentebene (Vorschau) filtert Suchergebnisse heraus, die ein Benutzer nicht anzeigen darf. Wenn bei mehreren Datenquellen die Datenquelle ein Zugriffssteuerungsmodell bereitstellt, können Sie einen Index konfigurieren, um die Metadaten der Benutzerberechtigungen zu vererben. |
| Ausgangssicherheit (Indexer) |
Datenverbindungen über private Endpunkte ermöglichen es einem Indexer, eine Verbindung mit Azure-Ressourcen herzustellen, die über Azure Private Link geschützt sind.
Datenverbindungen über verwaltete Identitäten authentifizieren Verbindungen mit Azure-Ressourcen mithilfe eines Microsoft Entra-Sicherheitsprinzipals, wodurch Speicher und die Übergabe hartcodierter API-Schlüssel vermieden werden. Datenzugriff mithilfe einer vertrauenswürdigen Identität bedeutet, dass Verbindungszeichenfolgen für externe Datenquellen keine Benutzernamen und Kennwörter enthalten müssen. Wenn ein Indexer eine Verbindung mit der Datenquelle herstellt, lässt die Ressource die Verbindung zu, wenn der Suchdienst zuvor als vertrauenswürdiger Dienst registriert wurde (gilt nur für Azure Storage). |
Features im Portal
| Category | Features |
|---|---|
| Tools für Prototyperstellung und Überprüfung |
Index hinzufügen ist ein Index-Designer im Azure-Portal, mit dem Sie ein grundlegendes Schema erstellen können, das aus Feldern mit Attributen und einigen anderen Einstellungen besteht. Nachdem Sie den Index gespeichert haben, können Sie ihn mithilfe eines SDK oder der REST-API auffüllen, um die Daten bereitzustellen.
Der Datenimport-Assistent erstellt Indizes, Indexer, Skillsets und Datenquellendefinitionen. Wenn Ihre Daten in Azure vorhanden sind, können Sie mit diesem Assistenten beträchtliche Zeit und Mühe sparen, insbesondere beim Untersuchen von Proof-of-Concepts-Szenarios. Der Assistent zum Importieren von Daten (neu) erstellt eine vollständige Indizierungspipeline, die Datenblöcke und Vektorisierung umfasst. Der Assistent erstellt alle Objekte und Konfigurationseinstellungen. Der Such-Explorer wird verwendet, um Abfragen zu testen und Bewertungsprofile zu verfeinern. Das Erstellen einer Demo-App wird verwendet, um eine HTML-Seite zu generieren, die zum Testen der Sucherfahrung verwendet werden kann. Debugsitzungen sind ein visueller Editor, mit dem Sie ein Skillset interaktiv debuggen können. Er zeigt Abhängigkeiten, Ausgabe und Transformationen an. |
| Überwachung und Diagnose | Durch das Aktivieren von Überwachungsfunktionen können neben den Metriken, die im Azure-Portal immer angezeigt werden, zusätzliche Metriken verwendet werden. Metriken zu Abfragen pro Sekunde, Latenz und Drosselung werden erfasst und in Portalseiten protokolliert, ohne dass hierzu eine zusätzliche Konfiguration erforderlich ist. |
Programmability
| Category | Features |
|---|---|
| REST |
Die Dienste-REST-API ist für Vorgänge auf Datenebene einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden.
Management-REST-API dient der Diensterstellung und -bereitstellung über Azure Resource Manager. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |
| Azure SDK für .NET |
Azure.Search.Documents ist für Vorgänge auf Datenebene einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden.
Microsoft.Azure.Management.Search dient zum Erstellen und Bereitstellen von Diensten über Azure Resource Manager. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |
| Azure SDK für Java |
com.azure.search.documents ist für Vorgänge auf Datenebene einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden.
com.microsoft.azure.management.search ist für die Diensterstellung und -bereitstellung über Azure Resource Manager vorgesehen. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |
| Azure SDK für Python |
azure-search-documents ist für Vorgänge auf Datenebene einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden.
azure-mgmt-search ist für die Diensterstellung und -bereitstellung über Azure Resource Manager vorgesehen. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |
| Azure SDK für JavaScript bzw. TypeScript |
azure/search-documents ist für Vorgänge auf Datenebene einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden.
azure/arm-search ist für die Diensterstellung und -bereitstellung über Azure Resource Manager vorgesehen. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |