Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Dieser Inhalt gilt für:
v4.0 (GA) | Vorherige Versionen:
v3.1 (GA) :::moniker-end
Dieser Inhalt gilt für:
v3.1 (GA) | Aktuelle Version:
v4.0 (GA)
Das Dokument Intelligenz-Steuermodell nutzt leistungsstarke Funktionen zur optischen Zeichenerkennung (Optical Character Recognition, OCR), um Schlüsselfelder und Positionen aus ausgewählten Steuerdokumenten zu analysieren und zu extrahieren. Steuerdokumente können verschiedene Formate aufweisen, wie z. B. 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA. Zu den Eingabeformaten gehören per Telefon aufgenommene Fotos, gescannte Dokumente und digitale PDFs. Die API analysiert Dokumenttext, extrahiert wichtige Informationen und gibt eine strukturierte JSON-Datendarstellung zurück. Das Modell unterstützt derzeit bestimmte englische Steuerdokumentformate.
Unterstützte Steuerformulartypen:
- Unified Tax US
- W-2
- 1.098
- 1098-E
- 1098-T
- 1099 und Variationen (1099-SSA hinzugefügt)
- 1040 und Variationen
- 1095A, 1095C
- W-4
Automatisierte Verarbeitung von Steuerdokumenten
Bei der automatisierten Verarbeitung von Steuerdokumenten werden Schlüsselfelder aus Steuerdokumenten extrahiert. In der Vergangenheit wurden Steuerdokumente manuell verarbeitet. Dieses Modell ermöglicht die einfache Automatisierung von Steuerszenarien.
Vereinheitlichte Steuer USA
Das vordefinierte Modell Unified US Tax erkennt und extrahiert Daten aus den Steuerformularen W2, 1098, 1040 und 1099 in übermittelten Dokumenten automatisch. Diese Dokumente können aus vielen steuerbezogenen oder nicht steuerbezognene Dokumenten bestehen. Das Modell verarbeitet nur die unterstützten Formulare.
Entwicklungsoptionen
Dokument Intelligenz Version 4.0: 2024-11-30 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
| Funktion | Ressourcen | Modell-ID |
|---|---|---|
| US-Steuerformularmodelle | • Dokument-Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us • prebuilt-tax.us.w2 • prebuilt-tax.us.W-4 • prebuilt-tax.us.1095A • prebuilt-tax.us.1095C • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T • prebuilt-tax.us.1099A • prebuilt-tax.us.1099B • prebuilt-tax.us.1099C • prebuilt-tax.us.1099CAP • prebuilt-tax.us.1099Combo • prebuilt-tax.us.1099DIV • prebuilt-tax.us.1099G • prebuilt-tax.us.1099H • prebuilt-tax.us.1099INT • prebuilt-tax.us.1099K • prebuilt-tax.us.1099LS • prebuilt-tax.us.1099LTC • prebuilt-tax.us.1099MISC • prebuilt-tax.us.1099NEC • prebuilt-tax.us.1099OID • prebuilt-tax.us.1099PATR • prebuilt-tax.us.1099Q • prebuilt-tax.us.1099QA • prebuilt-tax.us.1099R • prebuilt-tax.us.1099S • prebuilt-tax.us.1099SA • prebuilt-tax.us.1099SB • prebuilt-tax.us.1099SSA • prebuilt-tax.us.1040 • prebuilt-tax.us.1040Schedule1 • prebuilt-tax.us.1040Schedule2 • prebuilt-tax.us.1040Schedule3 • prebuilt-tax.us.1040Schedule8812 • prebuilt-tax.us.1040ScheduleA • prebuilt-tax.us.1040ScheduleB • prebuilt-tax.us.1040ScheduleC • prebuilt-tax.us.1040ScheduleD • prebuilt-tax.us.1040ScheduleE • prebuilt-tax.us.1040ScheduleEIC • prebuilt-tax.us.1040ScheduleF • prebuilt-tax.us.1040ScheduleH • prebuilt-tax.us.1040ScheduleJ • prebuilt-tax.us.1040ScheduleR • prebuilt-tax.us.1040ScheduleSE • prebuilt-tax.us.1040Senior |
Dokument-Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
| Funktion | Ressourcen | Modell-ID |
|---|---|---|
| US-Steuerformularmodelle | • Dokument-Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us.w2 • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T |
Dokument-Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
| Funktion | Ressourcen | Modell-ID |
|---|---|---|
| US-Steuerformularmodelle | • Dokument-Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us.w2 • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T |
Eingabeanforderungen
Die folgenden Dateiformate werden unterstützt.
| Modell | Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lesen | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Allgemeines Dokument | ✔ | ✔ | |
| Vordefiniert | ✔ | ✔ | |
| Benutzerdefinierte Extraktion | ✔ | ✔ | |
| Benutzerdefinierte Klassifizierung | ✔ | ✔ | ✔ |
- Fotos und Scans: Um optimale Ergebnisse zu erzielen, stellen Sie ein klares Foto oder eine qualitativ hochwertige Überprüfung pro Dokument bereit.
- PDFs und TIFFs: Für PDFs und TIFFs können bis zu 2.000 Seiten verarbeitet werden. (Bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet.)
- Dateigröße: Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
- Bildabmessungen: Die Abmessungen müssen zwischen 50 Pixel x 50 Pixel und 10.000 Pixel x 10.000 Pixel betragen.
- Kennwortsperrungen: Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
- Texthöhe: Die minimale Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Abmessung entspricht etwa 8-Punkt-Text bei 150 Punkten pro Zoll.
- Schulung für benutzerdefinierte Modelle: Die maximale Anzahl von Seiten für Schulungsdaten beträgt 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
- Schulung des benutzerdefinierten Extraktionsmodells: Die Gesamtgröße der Schulungsdaten beträgt 50 MB für das Vorlagenmodell und 1 GB für das neurale Modell.
- Schulung des benutzerdefinierten Klassifizierungsmodells: Die Gesamtgröße der Schulungsdaten beträgt 1 GB mit maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Schulungsdaten 2 GB mit maximal 10.000 Seiten.
- Office-Dateitypen (DOCX, XLSX, PPTX):Die maximale Zeichenfolgenlängenbeschränkung beträgt 8 Millionen Zeichen.
Testen der Datenextraktion bei Steuerdokumenten
Erfahren Sie, wie Daten, einschließlich Kundeninformationen, Herstellerdetails und Positionen, aus Rechnungen extrahiert werden. Sie benötigen die folgenden Ressourcen:
Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).
Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (
F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.
Dokument Intelligenz Studio
Wählen Sie auf der Startseite von Dokument Intelligenz Studio das unterstützte Model für Steuerdokumente aus.
Sie können ein Beispielsteuerdokument analysieren oder Ihre eigenen Dateien hochladen.
Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:
Unterstützte Sprachen und Gebietsschemas
Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung ‒ vordefinierte Modelle.
Feldextraktion
Weitere Informationen zu unterstützten Feldern für die Dokumentextraktion finden Sie in unserem GitHub-Beispielrepository auf der Seite mit dem Modellschema für Steuerdokumente.
Die extrahierten Schlüssel-Wert-Paare der Steuerdokumente und die Rechnungspositionen befinden sich im Abschnitt documentResults der JSON-Ausgabe.
Nächste Schritte
Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe von Dokument Intelligenz Studio zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.