Freigeben über


Dokument Intelligenz-Vertragsmodell

Dieser Inhalt gilt für:HäkchenVersion 4.0 (GA) | Vorherige Versionen:Blaues HäkchenVersion 3.1 (GA) :::moniker-end

Dieser Inhalt gilt für:HäkchenVersion 3.1 (GA) | Aktuelle Version:lila-häkchenVersion 4.0 (GA)

Das Vertragsmodell von Dokument Intelligenz nutzt leistungsstarke Funktionen zur optischen Zeichenerkennung (Optical Character Recognition, OCR), um Schlüsselfelder und Positionen aus einer ausgewählten Gruppe wichtiger Vertragselemente zu analysieren und zu extrahieren. Verträge können in verschiedenen Formaten und Qualitäten vorliegen, z. B. als mit dem Smartphone aufgenommene Bilder, als gescannte Dokumente oder als digitale PDF-Dateien. Die API analysiert den Dokumenttext, extrahiert Schlüsselinformationen wie z. B. Parteien, Gerichtsbarkeiten, Vertrags-ID und Titel und gibt eine strukturierte JSON-Darstellung der Daten zurück. Das Modell unterstützt derzeit englischsprachige Dokumentformate.

Automatisierte Vertragsverarbeitung

Bei der automatisierten Vertragsverarbeitung werden die wichtigsten Vertragsfelder aus den Dokumenten extrahiert. In der Vergangenheit wurde die Vertragsanalyse manuell durchgeführt und war daher sehr zeitaufwändig. Die akkurate Extraktion wesentlicher Daten aus Verträgen ist in der Regel der erste und einer der wichtigsten Schritte im Prozess der Vertragsautomatisierung.

Entwicklungsoptionen

Dokument Intelligenz Version 4.0: 2024-11-30 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion Ressourcen Modell-ID
Vertragsmodell Dokument-Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-contract

Dokument-Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion Ressourcen Modell-ID
Vertragsmodell Dokument-Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-contract

Dokument-Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion Ressourcen Modell-ID
Vertragsmodell Dokument-Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-contract

Eingabeanforderungen

Die folgenden Dateiformate werden unterstützt.

Modell PDF Bild:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lesen Sie
Layout
Allgemeines Dokument
Vordefiniert
Benutzerdefinierte Extraktion
Benutzerdefinierte Klassifizierung
  • Fotos und Scans: Um optimale Ergebnisse zu erzielen, stellen Sie ein klares Foto oder eine qualitativ hochwertige Überprüfung pro Dokument bereit.
  • PDFs und TIFFs: Für PDFs und TIFFs können bis zu 2.000 Seiten verarbeitet werden. (Bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet.)
  • Dateigröße: Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
  • Bildabmessungen: Die Abmessungen müssen zwischen 50 Pixel x 50 Pixel und 10.000 Pixel x 10.000 Pixel betragen.
  • Kennwortsperrungen: Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
  • Texthöhe: Die minimale Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Dimension entspricht etwa 8 Punkt Text bei 150 Punkten pro Zoll.
  • Schulung für benutzerdefinierte Modelle: Die maximale Anzahl von Seiten für Schulungsdaten beträgt 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
  • Schulung des benutzerdefinierten Extraktionsmodells: Die Gesamtgröße der Schulungsdaten beträgt 50 MB für das Vorlagenmodell und 1 GB für das neurale Modell.
  • Schulung des benutzerdefinierten Klassifizierungsmodells: Die Gesamtgröße der Schulungsdaten beträgt 1 GB mit maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Schulungsdaten 2 GB mit maximal 10.000 Seiten.
  • Office-Dateitypen (DOCX, XLSX, PPTX):Die maximale Zeichenfolgenlängenbeschränkung beträgt 8 Millionen Zeichen.

Testen der Datenextraktion aus Vertragsdokumenten

Erleben Sie aus erster Hand, wie Daten – z. B. Kundeninformationen, Details zu Lieferanten und Einzelpositionen – aus Verträgen extrahiert werden. Sie benötigen die folgenden Ressourcen:

  • Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunkt im Azure-Portal

Dokument Intelligenz Studio

  1. Wählen Sie auf der Startseite von Dokument Intelligenz Studio die Option Steuerdokumente aus.

  2. Sie können die Mustersteuerdokumente analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:

    Screenshot der Schaltflächen „Analyse ausführen“ und „Analyseoptionen“ im Document Intelligence Studio.

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachenfinden Sie unter Sprachunterstützung: vorgefertigte Modelle.

Feldextraktion

  • Weitere Informationen zu unterstützten Feldern für die Dokumentextraktion finden Sie in unserem GitHub-Beispielrepository auf der Seite mit dem Vertragsmodellschema.

  • Die aus dem Vertrag extrahierten Schlüssel-Wert-Paare und Einzelpositionen befinden sich im Abschnitt documentResults der JSON-Ausgabe.

Nächste Schritte