Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Wichtig
Für Dokumentintelligenzversionen v4.0-Vorschauversionen und zukünftige Versionen ist das allgemeine Dokumentmodell (vorgefertigtes Dokument) veraltet. Verwenden Sie die folgenden Modelle, um Schlüssel-Wert-Paare, Auswahlmarkierungen, Text, Tabellen und Strukturen aus Dokumenten zu extrahieren:
| Feature | version | Modell-ID |
|---|---|---|
Layout-Modell, bei dem der Abfragezeichenfolgenparameter features=keyValuePairs aktiviert ist. |
• v4:2024-11-30 • v3.1:2023-07-31 (GA) |
prebuilt-layout |
| Allgemeines Dokumentenmodell | • v3.1:2023-07-31 (allgemein verfügbar) • v3.0:2022-08-31 (allgemein verfügbar) • v2.1 (allgemein verfügbar) |
prebuilt-document |
Dieser Inhalt gilt für:
Version 3.1 (GA) | Aktuelle Version:
Version 4.0 (GA) | Vorherige Versionen:
Version 3.0
Dieser Inhalt gilt für:
Version 3.0 (GA) | Aktuelle Versionen:
Version 4.0 (GA)
Version 3.1
Das allgemeine Dokumentmodell kombiniert leistungsstarke OCR-Funktionen (optische Zeichenerkennung) mit Deep Learning-Modellen zur Extraktion von Schlüssel-Wert-Paaren, Tabellen und Auswahlmarkierungen aus Dokumenten. Das allgemeine Dokument ist mit den APIs v3.1 und v3.0 verfügbar. Weitere Informationen finden Sie im Migrationshandbuch.
Allgemeine Dokumentfeatures
Das allgemeine Dokumentmodell ist ein vortrainiertes Modell, das weder Beschriftungen noch Training erfordert.
Eine einzelne API extrahiert Schlüssel-Wert-Paare, Auswahlmarkierungen, Text, Tabellen und Strukturen aus Dokumenten.
Das allgemeine Dokumentmodell unterstützt strukturierte, teilweise strukturierte und unstrukturierte Dokumente.
Auswahlmarkierungen sind als Felder mit dem Wert
:selected:oder:unselected:gekennzeichnet.
Beispieldokument verarbeitet in Dokument Intelligenz Studio
Schlüssel-Wert-Paar-Extraktion
Die API für allgemeine Dokumente unterstützt die meisten Formulartypen und analysiert Ihre Dokumente und extrahiert Schlüssel und zugehörige Werte. Sie eignet sich ideal für die Extraktion gängiger Schlüssel-Werte-Paare aus Dokumenten. Sie können das allgemeine Dokumentenmodell als Alternative zum Training eines benutzerdefinierten Modells ohne Labels verwenden.
Entwicklungsoptionen
Document Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
| Feature | Ressourcen | Modell-ID |
|---|---|---|
| Allgemeines Dokumentenmodell | • Document Intelligence Studio • REST-API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-document |
Document Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
| Feature | Ressourcen | Modell-ID |
|---|---|---|
| Allgemeines Dokumentenmodell | • Document Intelligence Studio • REST-API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-document |
Eingabeanforderungen
Die folgenden Dateiformate werden unterstützt.
| Modell | Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lesen Sie | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Allgemeines Dokument | ✔ | ✔ | |
| Vordefiniert | ✔ | ✔ | |
| Benutzerdefinierte Extraktion | ✔ | ✔ | |
| Benutzerdefinierte Klassifizierung | ✔ | ✔ | ✔ |
- Fotos und Scans: Um optimale Ergebnisse zu erzielen, stellen Sie ein klares Foto oder eine qualitativ hochwertige Überprüfung pro Dokument bereit.
- PDFs und TIFFs: Für PDFs und TIFFs können bis zu 2.000 Seiten verarbeitet werden. (Bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet.)
- Dateigröße: Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
- Bildabmessungen: Die Abmessungen müssen zwischen 50 Pixel x 50 Pixel und 10.000 Pixel x 10.000 Pixel betragen.
- Kennwortsperrungen: Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
- Texthöhe: Die minimale Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Dimension entspricht etwa 8 Punkt Text bei 150 Punkten pro Zoll.
- Schulung für benutzerdefinierte Modelle: Die maximale Anzahl von Seiten für Schulungsdaten beträgt 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
- Schulung des benutzerdefinierten Extraktionsmodells: Die Gesamtgröße der Schulungsdaten beträgt 50 MB für das Vorlagenmodell und 1 GB für das neurale Modell.
- Schulung des benutzerdefinierten Klassifizierungsmodells: Die Gesamtgröße der Schulungsdaten beträgt 1 GB mit maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Schulungsdaten 2 GB mit maximal 10.000 Seiten.
- Office-Dateitypen (DOCX, XLSX, PPTX):Die maximale Zeichenfolgenlängenbeschränkung beträgt 8 Millionen Zeichen.
Datenextraktion für das allgemeine Dokumentmodell
Versuchen Sie, mithilfe von Dokument Intelligenz Studio Daten aus Formularen und Dokumenten zu extrahieren.
Sie benötigen die folgenden Ressourcen:
Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).
Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (
F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.
Hinweis
Dokument Intelligenz Studio und das allgemeine Dokumentmodell sind mit der API v3.0 verfügbar.
Wählen Sie auf der Startseite vom Document Intelligence StudioAllgemeine Dokumente aus.
Sie können das Musterdokument analysieren oder Ihre eigenen Dateien hochladen.
Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:
Schlüssel-Wert-Paare
Schlüssel-Wert-Paare sind bestimmte Bereiche innerhalb des Dokuments, die eine Beschriftung oder einen Schlüssel und die zugehörige Antwort oder den zugehörigen Wert identifizieren. In einem strukturierten Formular könnten diese Paare die Beschriftung und der Wert sein, die der Benutzer für dieses Feld eingegeben hat. In einem unstrukturierten Dokument kann es sich um das Datum handeln, an dem ein Vertrag basierend auf dem Text in einem Absatz erfüllt wurde. Das KI-Modell wird trainiert, um identifizierbare Schlüssel und Werte basierend auf einer Vielzahl von Dokumenttypen, Formaten und Strukturen zu extrahieren.
Schlüssel können auch isoliert existieren, wenn das Modell feststellt, dass ein Schlüssel ohne zugehörigen Wert vorhanden ist, oder wenn optionale Felder verarbeitet werden. Beispielsweise kann ein Feld für den zweiten Vornamen in einigen Fällen in einem Formular leer gelassen werden. Schlüssel-Wert-Paare sind Textabschnitte, die im Dokument enthalten sind. Bei Dokumenten, in denen derselbe Wert auf unterschiedliche Weise beschrieben wird, z. B. Kunde/Benutzer, ist der zugehörige Schlüssel entweder Kunde oder Benutzer (je nach Kontext).
Extrahieren von Daten
| Modell | Textextraktion | Schlüssel-Werte-Paare | Auswahlmarkierungen | Tabellen | Allgemeine Namen |
|---|---|---|---|---|---|
| Allgemeines Dokument | ✓ | ✓ | ✓ | ✓ | ✓* |
✓* – Nur in der 2023-07-31 API-Version (v3.1 GA) und mit späteren API-Versionen verfügbar.
Unterstützte Sprachen und Gebietsschemas
Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung – Dokumentanalysemodelle.
Überlegungen
Schlüssel sind Ausschnitte von Text, der aus dem Dokument extrahiert wurde. Für teilweise strukturierte Dokumente müssen Schlüssel möglicherweise einem vorhandenen Schlüsselwörterbuch zugeordnet werden.
Erwarten Sie, dass Schlüssel-Wert-Paare mit einem Schlüssel, aber ohne Wert angezeigt werden. Wenn ein Benutzer z. B. keine E-Mail-Adresse in das Formular eingeben möchte.
Nächste Schritte
Folgen Sie dem Migrationsleitfaden für Dokument Intelligenz 3.1, um zu erfahren, wie Sie die Version 3.1 in Ihren Anwendungen und Workflows verwenden können.
Erkunden Sie unsere REST API.