Erste Schritte mit Azure Document Intelligence

Abgeschlossen

Um ein Projekt mit Azure Document Intelligence-Diensten zu starten, benötigen Sie eine Azure-Ressource und eine Auswahl von Formulardateien für die Datenextraktion.

Abonnieren einer Ressource

Sie können über Folgendes auf Azure Document Intelligence-Dienste zugreifen:

  • Eine Ressource "Foundry Tools": ein Abonnementschlüssel, der für mehrere Foundry-Tools verwendet wird

ODER

  • Eine Azure Document Intelligence-Ressource: ein Einzeldienstabonnementschlüssel (nur mit einem bestimmten Azure AI-Dienst verwendet)

Hinweis

Erstellen Sie eine Ressource "Foundry Tools", wenn Sie beabsichtigen, unter einem einzelnen Endpunkt/Schlüssel auf mehrere Foundry Tools zuzugreifen. Erstellen Sie für den Azure Document Intelligence-Zugriff nur eine Azure Document Intelligence-Ressource. Beachten Sie, dass Sie eine Single-Service-Ressource benötigen, wenn Sie die Microsoft Entra-Authentifizierung verwenden möchten.

Sie können einen Dienst im Azure-Portal oder mit der Befehlszeilenschnittstelle (Cli) von Azure abonnieren. Weitere Informationen zu den CLI-Befehlen finden Sie hier.

Grundlegendes zu den Eingabeanforderungen für Azure Document Intelligence-Dateien

Azure Document Intelligence funktioniert für Eingabedokumente, die diese Anforderungen erfüllen:

  • Das Format muss JPG, PNG, BMP, PDF (Text oder gescannt) oder TIFF sein.
  • Die Datei muss im kostenpflichtigen Tarif (S0) kleiner als 500 MB und im kostenlosen Tarif (F0) kleiner als 4 MB sein.
  • Bei Bildern müssen die Abmessungen zwischen 50 × 50 Pixel und 10,000 × 10,000 Pixel liegen.
  • Die Gesamtgröße des Schulungsdatensatzes muss 500 Seiten oder weniger sein.

Weitere Eingabeanforderungen finden Sie in der Dokumentation für bestimmte Modelle.

Entscheiden, welche Komponente von Azure Document Intelligence verwendet werden soll

Nachdem Sie Ihre Dateien gesammelt haben, entscheiden Sie, was Sie erreichen müssen.

Anwendungsfall Empfohlene Features zur Verwendung
Verwenden von OCR-Funktionen zum Erfassen der Dokumentanalyse Verwenden Sie das Layoutmodell, das Lesemodell oder das allgemeine Dokumentmodell.
Erstellen einer Anwendung, die Daten aus W-2s, Rechnungen, Belege, ID-Dokumenten, Krankenversicherung, Impfungen und Visitenkarten extrahiert Verwenden Sie ein vorgefertigtes Modell. Diese Modelle müssen nicht trainiert werden. Azure Document Intelligence-Dienste analysieren die Dokumente und geben eine JSON-Ausgabe zurück.
Erstellen einer Anwendung zum Extrahieren von Daten aus branchenspezifischen Formularen Erstellen Sie ein benutzerdefiniertes Modell. Dieses Modell muss auf Beispieldokumenten trainiert werden. Nachdem Sie das benutzerdefinierte Modell trainiert haben, kann es neue Dokumente analysieren und eine JSON-Ausgabe zurückgeben.