Freigeben über


Azure Content Understanding in Foundry Tools-Dokumentlösungen

Wichtig

Diese Funktion ist in der Vorschau verfügbar. Öffentliche Vorschauversionen bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden. Features, Ansätze und Prozesse können sich vor der allgemeinen Verfügbarkeit noch ändern oder eine eingeschränkte Funktionalität aufweisen. Weitere Informationen finden Sie unter Zusätzliche Nutzungsbestimmungen für Microsoft Azure-Vorschauen.

Content Understanding bietet anspruchsvolle Dokumentanalysefunktionen. Organisationen können diese Funktionen verwenden, um unstrukturierte Inhalte in umsetzbare und organisierte Daten zu konvertieren. Content Understanding kann anpassbare Analysetools verwenden, um wichtige Informationen, Felder und Beziehungen aus einer Vielzahl von Dokumenten und Formularen zu extrahieren.

Anwendungsfälle für Unternehmen

Dokumentanalysatoren können komplexe Dokumente in verschiedenen Formaten und Vorlagen verarbeiten:

  • Verwaltung des Vertragslebenszyklus: Extrahieren Sie Schlüsselfelder, Klauseln und Verpflichtungen aus verschiedenen Vertragstypen.
  • Kredit- und Hypothekenanwendungen: Automatisieren Sie die Verarbeitung, um eine schnellere Abwicklung durch Banken, Kreditgeber und staatliche Einrichtungen zu ermöglichen.
  • Finanzdienstleistungen: Analysieren Sie komplexe Dokumente wie Finanzberichte und Vermögensverwaltungsberichte.
  • Spesenverwaltung: Analysieren Sie Quittungen und Rechnungen von verschiedenen Einzelhändlern, um Ausgaben in verschiedenen Formaten und Vorlagen zu überprüfen.
  • Dokumentenmappen und Wissensbasisszenarien: Extrahieren Sie Schlüsselfelder aus Dokumentenmappen als Ganzes. Fügen Sie Referenzdaten für Aufgaben wie Validierung und Anreicherung hinzu, indem Sie mehrstufiges Denken anwenden.

Hauptvorteile

Content Understanding bietet leistungsstarke Dokumentanalysefunktionen, die auf kritische Unternehmens- und Geschäftsszenarien wie RAG und robotergesteuerter Prozessautomatisierung ausgelegt sind. Zu den wichtigsten Vorteilen gehören:

  • Intelligente Suchaktivierung: Transformieren Sie unstrukturierte Dokumente in strukturierte, durchsuchbare Datenressourcen, um die Auffindbarkeit und Barrierefreiheit von Informationen in Ihrer Organisation zu verbessern.
  • Fundierte Datenextraktion: Sorgen Sie für eine klare Rückverfolgbarkeit und Lokalisierung der extrahierten Daten, um effiziente Überprüfungsprozesse mit menschlicher Beteiligung zu ermöglichen und Transparenz und Compliance zu gewährleisten.
  • Konfidenzgesteuerte Automatisierung: Nutzen Sie die integrierte Konfidenzbewertung, um Dokumentverarbeitungsaufgaben intelligent zu automatisieren und so die Ressourcenzuweisung zu optimieren, Betriebskosten zu senken und die Genauigkeit Ihrer Entscheidungen zu verbessern.
  • Flexible Anpassung: Passen Sie Dokumentanalysetools ganz einfach an bestimmte Geschäftsprozesse und Workflows an. Anpassungen ermöglichen eine präzise Extraktion und Klassifizierung, die auf die spezifischen Anforderungen Ihrer Organisation zugeschnitten ist.
  • Verbesserte Genauigkeit und Zuverlässigkeit: Erzielen Sie präzise Extraktion und Klassifizierung kritischer Geschäftsdaten, um Fehler zu reduzieren und die betriebliche Effizienz in automatisierten Workflows zu verbessern.
  • Bereit für die Nutzung von Agenten: Verarbeiten Sie Ihre unterschiedlichen Eingaben und liefern Sie die Ergebnisse in einem Standardformat, das für den Workflow eines Agenten geeignet ist. Ausgabeergebnisse können Ihrer Anwendung ein Verständnis der Benutzerabsicht vermitteln, mit Daten, die von einem strongly-typed Schema unterstützt werden, was das schnelle Abrufen von Daten in einem formatgerechten Zustand für Ihren Code erleichtert.

Dokumentanalysefunktionen

Screenshot des Dokumentextraktionsflusses.

Inhaltsextraktion

Die Inhaltsextraktion bildet die Grundlage der Dokumentanalysefunktionen für Content Understanding. Dieser Prozess wandelt unstrukturierte Dokumente in strukturierte, maschinenlesbare Daten um. Die Inhaltsextraktion erfasst gedruckten und handgeschriebenen Text präzise und bewahrt gleichzeitig die Struktur des Dokuments durch eine fortschrittliche Layoutanalyse:

  • Inhaltsanalyse
    • Text: Verarbeitet mehrsprachige Inhalte, einschließlich maschinengedruckter und handschriftlicher Text aus Hunderten von Sprachen.
    • Auswahlmarken: Identifiziert und extrahiert Auswahlindikatoren wie Kontrollkästchen, Schaltflächen und ähnliche Markierungen.
    • Barcodeerkennung: Überprüft und decodiert Informationen aus über einem Dutzend Arten von linearen und zweidimensionalen Barcodes.
    • Mathematische Formeln: Erfasst und behält komplexe mathematische Ausdrücke im LaTeX-Format bei.
    • Bildelemente: Sucht und extrahiert Bilder, Abbildungen, Diagramme und Schaubilder zusammen mit ihren zugehörigen Beschriftungen und Anmerkungen.
    • Hyperlinkelemente: Erkennt Links, die in das Dokument eingebettet sind.
    • Anmerkungselemente: Ordnet Inhalte ihren Anmerkungen zu, z. B. Durchgestrichenes, Unterstrichenes, Hervorhebungen.
    • Abbildungselemente: Erkennt und extrahiert Abbildungselemente zu einer strukturierten Ausgabe.
  • Strukturanalyse
    • Absätze: Erkennt und kategorisiert Textsegmente basierend auf ihrem Dokumentkontext und ihrer Rolle.
    • Tabellarische Daten: Erkennt und extrahiert Tabellenstrukturen, einschließlich komplexer Formate mit übergreifenden Zellen und mehrseitigen Layouts.
    • Hierarchische Abschnitte: Strukturiert die Inhalte mit Abschnittsüberschriften und untergeordneten Inhaltsbeziehungen.
  • Retrieval-Augmented Generation (RAG)
    • RAG-Lösungen: Die Inhaltsextraktion bildet die Grundlage für effektive RAG-Systeme, indem sie unbearbeitete multimodale Daten in strukturierte, durchsuchbare Formate umwandelt, die für die Abfrage optimiert sind. Weitere Informationen zum Erstellen von RAG-Lösungen finden Sie unter Retrieval-Augmented Generation.

Feldextraktion

Mit der Feldextraktion können Sie strukturierte Daten aus verschiedenen Dokumenten und Formularen extrahieren, klassifizieren und generieren, die an Ihre Anforderungen angepasst sind. Der Prozess der Transformation unstrukturierter Inhalte in organisierte, umsetzbare Informationen vereinfacht die Datenverwaltung, verbessert die Suchbarkeit und unterstützt automatisierte Workflows.

Beispielsweise können Sie Kundendaten, Rechnungsadressen und Einzelposten nahtlos aus Rechnungen extrahieren. Sie können auch Vertragsparteien, Verlängerungsdaten und Zahlungsbedingungen in rechtlichen Vereinbarungen identifizieren. Um die Effizienz zu maximieren, können Sie vorgefertigte Analyseschablonen verwenden, beispielsweise Schablonen, die speziell auf Rechnungen zugeschnitten sind. Sie können auch maßgeschneiderte Analysetools von Grund auf neu entwerfen, um die Genauigkeit durch die Bezeichnung weiterer Musterdokumente zu verbessern.

Die Konfidenz- und Grounding-API ist ein Feature zum Abonnieren. Um Vertrauen und Grounding für die Feldextraktion zu schaffen, legen Sie estimateFieldSourceAndConfidence = true in der Analyserkonfiguration fest oder verwenden Sie estimateSourceAndConfidence = true für ein bestimmtes Feld.

Feldextraktionsmethoden

Content Understanding bietet vielseitige Methoden zur Feldextraktion, die eine präzise und maßgeschneiderte Verarbeitung von Dokumentinhalten ermöglichen:

  • Extrakt: Extrahieren Sie bestimmte Daten, z. B. Transaktionsdaten aus Quittungen oder Positionen aus Rechnungen, für die genaue und fokussierte Informationserfassung.
  • Klassifizieren: Kategorisieren Sie Dokumentinhalte in vordefinierte Kategorien, z. B. die Klassifizierung von Stimmungen in Transkripten von Kundengesprächen oder die Klassifizierung von Posten auf Hotelrechnungen.
  • Generieren: Erstellen Sie neue Erkenntnisse oder Zusammenfassungen aus Ihren Dokumenten, einschließlich Dokumentenzusammenfassungen und Kapitelübersichten, um die Barrierefreiheit und Verständlichkeit der Inhalte zu verbessern.

Eingabeanforderungen

Weitere Informationen zu unterstützten Eingabedokumentformaten finden Sie unter Dienstkontingente und Grenzwerte.

Unterstützte Sprachen und Regionen

Eine Liste der unterstützten Sprachen und Regionen finden Sie unter Sprach- und Regionsunterstützung.

Daten, Datenschutz und Sicherheit

Entwickler, die Content Understanding verwenden, sollten die Richtlinien von Microsoft zur Verwendung von Kundendaten überprüfen. Weitere Informationen finden Sie unter "Daten", "Datenschutz" und "Sicherheit".