Erste Schritte mit Azure Document Intelligence
Um ein Projekt mit Azure Document Intelligence-Diensten zu starten, benötigen Sie eine Azure-Ressource und eine Auswahl von Formulardateien für die Datenextraktion.
Abonnieren einer Ressource
Sie können über Folgendes auf Azure Document Intelligence-Dienste zugreifen:
- Eine Ressource "Foundry Tools": ein Abonnementschlüssel, der für mehrere Foundry-Tools verwendet wird
ODER
- Eine Azure Document Intelligence-Ressource: ein Einzeldienstabonnementschlüssel (nur mit einem bestimmten Azure AI-Dienst verwendet)
Hinweis
Erstellen Sie eine Ressource "Foundry Tools", wenn Sie beabsichtigen, unter einem einzelnen Endpunkt/Schlüssel auf mehrere Foundry Tools zuzugreifen. Erstellen Sie für den Azure Document Intelligence-Zugriff nur eine Azure Document Intelligence-Ressource. Beachten Sie, dass Sie eine Single-Service-Ressource benötigen, wenn Sie die Microsoft Entra-Authentifizierung verwenden möchten.
Sie können einen Dienst im Azure-Portal oder mit der Befehlszeilenschnittstelle (Cli) von Azure abonnieren. Weitere Informationen zu den CLI-Befehlen finden Sie hier.
Grundlegendes zu den Eingabeanforderungen für Azure Document Intelligence-Dateien
Azure Document Intelligence funktioniert für Eingabedokumente, die diese Anforderungen erfüllen:
- Das Format muss JPG, PNG, BMP, PDF (Text oder gescannt) oder TIFF sein.
- Die Datei muss im kostenpflichtigen Tarif (S0) kleiner als 500 MB und im kostenlosen Tarif (F0) kleiner als 4 MB sein.
- Bei Bildern müssen die Abmessungen zwischen 50 × 50 Pixel und 10,000 × 10,000 Pixel liegen.
- Die Gesamtgröße des Schulungsdatensatzes muss 500 Seiten oder weniger sein.
Weitere Eingabeanforderungen finden Sie in der Dokumentation für bestimmte Modelle.
Entscheiden, welche Komponente von Azure Document Intelligence verwendet werden soll
Nachdem Sie Ihre Dateien gesammelt haben, entscheiden Sie, was Sie erreichen müssen.
| Anwendungsfall | Empfohlene Features zur Verwendung |
|---|---|
| Verwenden von OCR-Funktionen zum Erfassen der Dokumentanalyse | Verwenden Sie das Layoutmodell, das Lesemodell oder das allgemeine Dokumentmodell. |
| Erstellen einer Anwendung, die Daten aus W-2s, Rechnungen, Belege, ID-Dokumenten, Krankenversicherung, Impfungen und Visitenkarten extrahiert | Verwenden Sie ein vorgefertigtes Modell. Diese Modelle müssen nicht trainiert werden. Azure Document Intelligence-Dienste analysieren die Dokumente und geben eine JSON-Ausgabe zurück. |
| Erstellen einer Anwendung zum Extrahieren von Daten aus branchenspezifischen Formularen | Erstellen Sie ein benutzerdefiniertes Modell. Dieses Modell muss auf Beispieldokumenten trainiert werden. Nachdem Sie das benutzerdefinierte Modell trainiert haben, kann es neue Dokumente analysieren und eine JSON-Ausgabe zurückgeben. |