Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Azure KI Services unterstützen Entwickler und Unternehmen bei der schnellen Erstellung intelligenter, hochmoderner, marktreifer und verantwortungsbewusster Anwendungen mit sofort einsatzbereiten, vordefinierte und anpassbaren APIs und Modellen.
In diesem Artikel werden KI-Dienste behandelt, die gezielte Sprachverarbeitungsfunktionen wie Natural Language Processing (NLP), Textanalyse, Sprachverständnis, Übersetzung und Dokumentendatenextraktion bieten. Microsoft Azure AI Language ist eine der umfassendsten Kategorien bei KI-Diensten. Sie können die APIs in Ihrer Workload verwenden, um Sprachfeatures wie Named Entity Recognition (NER), Stimmungsanalyse, Spracherkennung und Textzusammenfassung zu integrieren.
Dienste
Die folgenden Dienste bieten gezielte Sprachverarbeitungsfunktionen für KI-Dienste:
Sprache bietet NLP für die Textanalyse.
Gebrauchen Sprache, wenn Sie mit strukturierten oder unstrukturierten Dokumenten für die breite Palette von sprachbezogenen Aufgaben arbeiten müssen, die in diesem Artikel beschrieben werden.
Nicht verwenden Sprache, wenn Sie Dokumente mit dem Chat durchsuchen, sie auf Inhaltssicherheit überprüfen oder übersetzen müssen.
Microsoft Azure AI Translator ist ein maschineller Übersetzungsdienst. Es kann Echtzeit-Textübersetzungen, Batch- und Einzeldatei-Dokumentübersetzungen sowie benutzerdefinierte Übersetzungen durchführen, mit denen Sie Fachterminologie oder branchenspezifische Sprache für Ihr Szenario integrieren können. Der Übersetzer unterstützt mehrere Sprachen.
Gebrauchen Übersetzer, wenn Sie eine Übersetzung speziell durchführen müssen. Sie können andere universelle Basissprachmodelle verwenden, um die Übersetzung durchzuführen. Die Verwendung von Translator für seinen speziellen Zweck kann jedoch aufgrund seiner gezielten Übersetzungsmodelle effektiver und kostengünstiger sein.
Nicht verwenden Übersetzer, wenn Sie mit Chats interagieren, Inhalte auf Stimmung analysieren oder Inhalte moderieren müssen. Verwenden Sie für die Stimmungsanalyse stattdessen Sprache. Verwenden Sie für die Inhaltsmoderation Microsoft Azure AI Content Safety.
Azure KI Dokument Intelligenz ist ein Dienst, der Bilder direkt in elektronische Formulare umwandeln kann. Sie können erwartete Felder angeben und dann Bilder durchsuchen, die Sie bereitstellen, um diese Felder ohne menschliches Eingreifen zu erfassen. Document Intelligence hostet viele vorgefertigte Modelle und ermöglicht es Ihnen auch, eigene benutzerdefinierte Modelle zu erstellen.
Gebrauchen Document Intelligence, wenn Sie genau wissen, welche Felder Sie aus gescannten Dokumenten extrahieren müssen, um elektronische Formulare ordnungsgemäß auszufüllen.
Gebrauchen Document Intelligence zur Identifizierung wichtiger Strukturen, wie z. B. Kopf- und Fußzeilen und Kapitelumbrüche, in verschiedenen Sammlungen von Dokumenten, um weiter programmgesteuert mit dem Dokument zu interagieren, z. B. in einer RAG-Implementierung (Retrieval Augmented Generation).
Nicht verwenden Document Intelligence als Echtzeit-Such-API.
Azure OpenAI in Foundry-Modellen
Azure OpenAI in Foundry Models bietet REST-API-Zugriff auf die leistungsstarken Sprachmodelle von OpenAI. Zu diesen Modellen gehören O3-Mini, O1, O1-Mini, GPT-4o, GPT-4o Mini, GPT-4 Turbo with Vision, GPT-4, GPT-3.5-Turbo und die Modellreihe Embeddings. Diese Modelle sind hochgradig anpassungsfähig, sodass Sie sie für Aufgaben wie Inhaltsgenerierung, Zusammenfassung, Bildanalyse und semantische Suche anpassen können. Sie unterstützen auch die Übersetzung von natürlicher Sprache in Code, was sie vielseitig für verschiedene Anwendungen macht.
Fähigkeiten
Die folgende Tabelle enthält eine Liste der Funktionen, die in Azure OpenAI verfügbar sind.
| Fähigkeit | Beschreibung |
|---|---|
| Textgenerierung und -vervollständigung | Generiert menschenähnlichen Text auf der Grundlage von Eingabeaufforderungen, vervollständigt automatisch Sätze oder Absätze, fasst lange Dokumente zu prägnanten Zusammenfassungen zusammen und beantwortet Fragen basierend auf dem Kontext. |
| Plaudern | Erstellen Sie Chatbots und virtuelle Assistenten, behalten Sie den Kontext in Konversationen mit mehreren Durchläufen bei und personalisieren Sie Antworten basierend auf der Benutzerinteraktion. |
| Assistenten | Schaffen Sie ein Copilot-ähnliches Erlebnis, das eine konsistente Persönlichkeit über alle Benutzerinteraktionen hinweg beibehält. Ermöglichen Sie die gleichzeitige Verwendung mehrerer Tools, z. B. Codeimplementierung und Wissenssuche. |
| Einbettungen | Konvertieren Sie Text in numerische Vektoren, bei denen ähnliche Bedeutungen im Vektorraum nahe beieinander liegen. Dieser Prozess ermöglicht eine leistungsstarke Ähnlichkeitssuche in Diensten wie Azure AI Search, Azure Cosmos DB, Azure SQL-Datenbank und Azure Database for PostgreSQL. |
| Inhaltsfilterung | Überprüft sowohl Benutzereingaben als auch KI-Ausgaben auf schädliche Inhalte in Kategorien wie Hass, sexuelle Inhalte, Gewalt und Selbstverletzung mit Unterstützung für mehrere Sprachen. Außerdem werden Nutzungsmuster überwacht, um die Einhaltung der Vorschriften sicherzustellen. |
| LLM-Anpassung | Bietet Modellanpassungstechniken, einschließlich Prompt Engineering für schnelle Anpassungen, RAG für die Einbeziehung externer Informationen und Feinabstimmung, um das Modell für spezielle Aufgaben zu trainieren. Sie können diese Methoden kombinieren, um die Leistung für bestimmte Anwendungsfälle zu optimieren. |
Sprache
Language ist ein Cloud-basierter Dienst, der NLP-Funktionen zum Verstehen und Analysieren von Text bereitstellt. Verwenden Sie diesen Dienst, um intelligente Anwendungen mithilfe des webbasierten Language Studio, der REST-APIs und der Clientbibliotheken zu erstellen.
Fähigkeiten
Die folgende Tabelle enthält eine Liste der Funktionen, die in Language verfügbar sind.
| Fähigkeit | Beschreibung |
|---|---|
| Benutzerdefinierte Fragen und Antworten | Findet die am besten geeignete Antwort für Eingaben Ihrer Benutzer. Es wird häufig zum Erstellen von Konversationsclientanwendungen verwendet, z. B. Social-Media-Anwendungen, Chatbots und sprachaktivierte Desktopanwendungen. |
| Benutzerdefinierte Textklassifizierung | Erstellt benutzerdefinierte KI-Modelle, um unstrukturierte Textdokumente in benutzerdefinierte Klassen zu klassifizieren, die Sie definieren. |
| Gesprächsverständnis (CLU) | Erstellen Sie benutzerdefinierte Modelle zum Verständnis natürlicher Sprache, um die Gesamtabsicht einer eingehenden Nachricht vorherzusagen und wichtige Informationen daraus zu extrahieren. |
| Entitätsverknüpfung | Verdeutlicht die Identität von Wörtern oder Phrasen, die in unstrukturiertem Text gefunden werden, und gibt Links zu Wikipedia zurück. |
| Sprachenerkennung | Erkennt die Sprache, in der ein Dokument verfasst ist, und gibt einen Sprachcode für eine Vielzahl von Sprachen, Varianten, Dialekten und einigen regionalen oder kulturellen Sprachen zurück. |
| Schlüsselbegriffserkennung | Wertet die Hauptkonzepte in unstrukturiertem Text aus, gibt sie zurück und gibt sie als Liste zurück. |
| NER | Kategorisiert Wörter oder Ausdrücke in unstrukturiertem Text in mehreren vordefinierten Kategoriegruppen, z. B. Personen, Ereignisse, Orte und Daten. |
| Orchestrierungsworkflow | Verwenden Sie diese Option, um eine Verbindung mit CLU herzustellen. |
| Personenbezogene Daten (PII) und Erkennung personenbezogener Gesundheitsdaten | Identifiziert, kategorisiert und schwärzt vertrauliche Informationen sowohl in unstrukturierten Textdokumenten als auch in Gesprächsprotokollen, wie z. B. Telefonnummern, E-Mail-Adressen und Identifikationsformen. Weitere Informationen finden Sie unter Unterstützte Entitätskategorien für personenbezogene Daten. |
| Stimmungsanalyse und Opinion Mining | Hilft Ihnen zu verstehen, was die Menschen über Ihre Marke oder Ihr Thema denken, indem Sie den Text auf Anzeichen einer positiven oder negativen Stimmung analysieren und ihn mit bestimmten Aspekten des Inhalts verknüpfen. |
| Zusammenfassung | Verwendet die extraktive Textzusammenfassung, um eine Zusammenfassung von Dokumenten und Unterhaltungstranskriptionen zu erstellen. Es extrahiert Sätze, die zusammen die wichtigsten oder relevantesten Informationen innerhalb des ursprünglichen Inhalts darstellen. |
| Textanalyse für Gesundheit | Extrahiert und beschriftet relevante medizinische Informationen aus unstrukturierten Texten wie Arztbriefen, Entlassungsberichten, klinischen Dokumenten und elektronischen Krankenakten. Wenn Sie Ihre Workload entwerfen, bewerten Sie den Verarbeitungsort und die Datenresidenz dieses in der Cloud gehosteten Features, um sicherzustellen, dass es Ihren Complianceerwartungen entspricht. Einige Workloads sind möglicherweise in ihrer Fähigkeit eingeschränkt, Gesundheitsdaten an eine in der Cloud gehostete Plattform zu senden. Sie können diese API als Docker-Container verwenden, um sie in Ihrem eigenen Compute in der Cloud oder lokal zu hosten. Dieser Prozess kann dazu beitragen, Compliance-Bedenken zu lösen, die Platform-as-a-Service umfassen. Weitere Informationen finden Sie unter Verwenden der Textanalyse für Integritätscontainer. |
Anwendungsfälle
Die folgende Tabelle enthält eine Liste möglicher Anwendungsfälle für Language.
Wenn eine Funktion anpassbar ist, können Sie ein KI-Modell mit unseren Tools trainieren, um es an Ihre spezifischen Daten anzupassen. Andernfalls ist die Funktion vorkonfiguriert, was bedeutet, dass ihre KI-Modelle unverändert bleiben. Sie stellen Ihre Daten bereit und verwenden die Ausgabe der Funktion in Ihren Anwendungen.
Übersetzer
Translator ist ein maschineller Übersetzungsdienst, der Teil der KI-Dienste ist. Der Übersetzer unterstützt viele Microsoft-Produkte und -Dienste.
Fähigkeiten
Die folgende Tabelle enthält eine Liste der Funktionen, die in Translator verfügbar sind.
| Fähigkeit | Beschreibung |
|---|---|
| Übersetzung von Azure Text | Führen Sie Textübersetzungen zwischen unterstützten Ausgangs- und Zielsprachen in Echtzeit durch. Erstellen Sie ein dynamisches Wörterbuch , und erfahren Sie, wie Sie Übersetzungen mithilfe der Übersetzer-API verhindern können. |
| Dokumentübersetzung |
Asynchrone Batch-Übersetzung: Übersetzen Sie Stapel- und komplexe Dateien unter Beibehaltung der Struktur und des Formats der Originaldokumente. Für den Batchübersetzungsprozess ist ein Azure Blob Storage-Konto erforderlich, das über Container für die Quelldokumente und die übersetzten Dokumente verfügt.
Synchrone Übersetzung einzelner Dateien: Übersetzen Sie eine einzelne Dokumentdatei allein oder mit einer Glossardatei, wobei die Struktur und das Format des Originaldokuments beibehalten werden. Für den Dateikonvertierungsprozess ist kein Blob Storage-Konto erforderlich. Die endgültige Antwort enthält das übersetzte Dokument und wird direkt an den aufrufenden Client zurückgegeben. |
| Benutzerdefinierter Translator | Erstellen Sie angepasste Modelle, um domänen- und branchenspezifische Sprache, Terminologie und Stile zu übersetzen. Erstellen Sie ein Wörterbuch (Ausdruck oder Satz) für benutzerdefinierte Übersetzungen. |
Anwendungsfälle
Die folgende Tabelle enthält eine Liste möglicher Anwendungsfälle für Translator.
| Anwendungsfall | Dokumentation |
|---|---|
| Übersetzen von branchenspezifischen Texten. | Benutzerdefinierter Translator |
| Übersetzen Sie allgemeine Texte, die nicht branchenspezifisch sind. | Übersetzung von Azure Text |
Dokument Intelligenz
Language ist ein Cloud-basierter Dienst, der NLP-Funktionen zum Verstehen und Analysieren von Text bereitstellt. Verwenden Sie diesen Dienst, um intelligente Anwendungen mithilfe des webbasierten Language Studio, der REST-APIs und der Clientbibliotheken zu erstellen.
Fähigkeiten
Die folgende Tabelle enthält eine Liste einiger der Funktionen, die in Document Intelligence verfügbar sind.
| Fähigkeit | Beschreibung |
|---|---|
| Visitenkarte extrahieren | Das Visitenkartenmodell von Dokument Intelligenz kombiniert OCR-Funktionen (Optical Character Recognition) mit Deep Learning-Modellen, um Daten aus Visitenkartenbildern zu analysieren und zu extrahieren. Die API analysiert gedruckte Visitenkarten, extrahiert wichtige Informationen wie Vorname, Nachname, Firmenname, E-Mail-Adresse und Telefonnummer und gibt dann eine strukturierte JSON-Datendarstellung zurück. |
| Extraktion des Vertragsmodells | Das Document Intelligence-Vertragsmodell verwendet OCR-Funktionen, um Schlüsselfelder und Einzelposten aus einer ausgewählten Gruppe wichtiger Vertragseinheiten zu analysieren und zu extrahieren. Verträge können in verschiedenen Formaten und Qualitäten vorliegen, einschließlich telefonisch aufgenommener Bilder, gescannter Dokumente und digitaler PDFs. Die API analysiert den Dokumenttext, extrahiert wichtige Informationen wie Parteien, Gerichtsbarkeiten, Vertrags-ID und Titel und gibt dann eine strukturierte JSON-Datendarstellung zurück. Das Modell unterstützt derzeit Dokumentformate in englischer Sprache. |
| Extraktion von Kreditkarten | Das Document Intelligence-Kredit-/Debitkartenmodell verwendet OCR-Funktionen, um Schlüsselfelder von Kredit- und Debitkarten zu analysieren und zu extrahieren. Kredit- und Debitkarten können in verschiedenen Formaten und Qualitäten vorliegen, darunter per Telefon aufgenommene Bilder, gescannte Dokumente und digitale PDFs. Die API analysiert den Dokumenttext, extrahiert wichtige Informationen wie Kartennummer, ausstellende Bank und Ablaufdatum und gibt dann eine strukturierte JSON-Datendarstellung zurück. Das Modell unterstützt derzeit Dokumentformate in englischer Sprache. |
| Extraktion der Krankenversicherungskarte | Das Document Intelligence-Krankenversicherungskartenmodell kombiniert OCR-Funktionen mit Deep-Learning-Modellen, um wichtige Informationen aus US-Krankenversicherungskarten zu analysieren und zu extrahieren. Eine Krankenversicherungskarte ist ein wichtiges Dokument für die Verarbeitung von Gesundheitsdaten. Sie kann digital analysiert werden, um die Aufnahme von Patienten, Informationen zur finanziellen Absicherung, bargeldlose Zahlungen und Versicherungsansprüche zu verarbeiten. Das Krankenversicherungskartenmodell analysiert Bilder von Gesundheitskarten, extrahiert wichtige Informationen wie Versicherer, Mitglied, Rezept und Gruppennummer und gibt dann eine strukturierte JSON-Darstellung zurück. Krankenversicherungskarten können in verschiedenen Formaten und Qualitäten vorliegen, darunter per Telefon aufgenommene Bilder, gescannte Dokumente und digitale PDFs. |
| Extraktion von US-Steuerdokumenten | Das Document Intelligence-Vertragsmodell verwendet OCR-Funktionen, um Schlüsselfelder und Einzelposten aus einer ausgewählten Gruppe von Steuerdokumenten zu analysieren und zu extrahieren. Steuerdokumente können in verschiedenen Formaten und Qualitäten vorliegen, einschließlich telefonisch aufgenommener Bilder, gescannter Dokumente und digitaler PDFs. Die API analysiert den Dokumenttext, extrahiert wichtige Informationen wie Kundenname, Rechnungsadresse, Fälligkeitsdatum und fälligen Betrag und gibt dann eine strukturierte JSON-Datendarstellung zurück. Das Modell unterstützt derzeit bestimmte Steuerdokumentformate in englischer Sprache. |
| Clientbibliotheken | Document Intelligence unterstützt eine vielzahl von Modellen, mit denen Sie Ihren Apps und Flüssen intelligente Dokumentverarbeitung hinzufügen können. Sie können ein vordefiniertes domänenspezifisches Modell oder ein benutzerdefiniertes Modell trainieren, das auf Ihre spezifischen Geschäftsanforderungen und Anwendungsfälle zugeschnitten ist. Dokument Intelligenz kann mit der REST-API oder Python-, C#-, Java- und JavaScript-Clientbibliotheken verwendet werden. |
Weitere Informationen zu Modellszenarien finden Sie unter Welches Modell sollte ich auswählen?
Nächste Schritte
- Was ist Language?
- Lernpfad: NLP-Lösungen mit KI-Services entwickeln
- Lernpfad: Erste Schritte mit KI-Diensten