Was ist Azure Document Intelligence?
Azure Document Intelligence ist einer von vielen Foundry Tools, cloudbasierten Ki-Diensten (Künstliche Intelligenz) mit REST-APIs und Clientbibliotheks-SDKs, die zum Erstellen von Intelligenz in Ihre Anwendungen verwendet werden können.
Azure Document Intelligence verwendet OCR-Funktionen (Optical Character Recognition) und Deep Learning-Modelle, um Text, Schlüsselwertpaare, Auswahlzeichen und Tabellen aus Dokumenten zu extrahieren.
OCR erfasst die Dokumentstruktur, indem umgebende Felder um erkannte Objekte in einem Bild erstellt werden. Die Positionen der umgebenden Felder werden als Koordinaten im Verhältnis zum Rest der Seite aufgezeichnet. Azure Document Intelligence-Dienste geben umgebende Felddaten und andere Informationen in einem strukturierten Formular mit den Beziehungen aus der ursprünglichen Datei zurück.
Um ein präzises Modell von Grund auf neu zu erstellen, müssen die Benutzer Deep Learning-Modelle erstellen, eine große Menge an Rechenressourcen verwenden und lange Modellschulungszeiten haben. Diese Faktoren könnten dazu führen, dass ein Projekt nicht zu berücksichtigen ist. Azure Document Intelligence bietet zugrunde liegende Modelle, die auf Tausenden von Formularbeispielen trainiert wurden. Mit den zugrunde liegenden Modellen können Sie die Datenextraktion mit hoher Genauigkeit aus Ihren Formularen mit wenig bis ohne Modellschulung durchführen.
Azure Document Intelligence-Dienstkomponenten
Azure Document Intelligence besteht aus den folgenden Diensten:
Dokumentanalysemodelle: die eine Eingabe von JPEG-, PNG-, PDF- und TIFF-Dateien übernehmen und eine JSON-Datei mit dem Speicherort von Text in umgebenden Feldern, Textinhalten, Tabellen, Auswahlzeichen (auch als Kontrollkästchen oder Optionsfelder bezeichnet) und Dokumentstruktur zurückgeben.
Vordefinierte Modelle: welche Informationen aus Dokumentbildern erkennen und extrahieren und die extrahierten Daten in einer strukturierten JSON-Ausgabe zurückgeben. Azure Document Intelligence unterstützt derzeit vorgefertigte Modelle für mehrere Formulare, darunter:
- W-2-Formulare
- Rechnungen
- Einnahmen
- ID-Dokumente
- Visitenkarten
Benutzerdefinierte Modelle: Benutzerdefinierte Modelle extrahieren Daten aus Formularen, die für Ihr Unternehmen spezifisch sind. Benutzerdefinierte Modelle können über die Azure Document Intelligence Studiotrainiert werden.
Hinweis
Einige Azure Document Intelligence-Features befinden sich in der Vorschau, ab dem Zeitpunkt, zu dem diese Inhalte erstellt wurden, und daher können sich Features und Nutzungsdetails ändern. Informationen zu up-to-datum finden Sie auf der offiziellen Seite.
Zugriffsdienste
Sie können auf verschiedene Arten auf Azure Document Intelligence-Dienste zugreifen. Zu diesen Optionen gehören die Verwendung von:
- EINE REST-API
- Clientbibliotheks-SDKs
- Azure Document Intelligence Studio
- Microsoft Foundry
Tipp
Die Übung dieses Moduls konzentriert sich auf die Python- und .NET-SDKs. Die zugrunde liegenden REST-Dienste können von jeder Sprache verwendet werden.
Sehen Sie sich die Dokumentation für Schnellstarthandbücher für alle verfügbaren SDKs und die REST-API an.