Freigeben über


Dokumentintelligenzmodelle für Hypothekendokumente

Dieser Inhalt gilt für:HäkchenVersion 4.0 (GA)

Die Dokumentintelligenzmodelle für Hypotheken verwendet leistungsstarke OCR (Optical Character Recognition)-Funktionen und Deep Learning-Modelle, um Schlüsselfelder aus Hypothekendokumenten zu analysieren und zu extrahieren. Hypothekendarlehen können in verschiedenen Formaten und Qualitäten vorliegen. Die API analysiert Hypothekendokumente und gibt eine strukturierte JSON-Datendarstellung zurück. Die Modelle unterstützen derzeit nur Dokumente in englischer Sprache. Mit der neuesten Version 4.0 können Sie jetzt Signaturen aus Hypothekenanträgen und -formularen extrahieren.

Unterstützte Dokumenttypen:

  • Einheitlicher Antrag für ein Wohnungsbaudarlehen (Formular 1003)
  • Einheitlicher Bericht über die Bewertung von Wohnimmobilien (Uniform Residential Appraisal Report, Formular 1004)
  • Formular „Überprüfung der Beschäftigung“ (Verification Of Employment Form, Formular 1005)
  • Einheitliche Zeichnungs- und Übertragungszusammenfassung (Formular 1008)
  • Offenlegung des Abschlusses-Formular

Entwicklungsoptionen

Dokument Intelligenz Version 4.0 (2024-11-30-GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion Ressourcen Modell-ID
Hypothekenmodell Document Intelligence Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-hypothek.us.1003
• prebuilt-hypothek.us.1004
• prebuilt-hypothek.us.1005
• prebuilt-hypothek.us.1008
• prebuilt-hypothek.us.closingDisclosure

Eingabeanforderungen

Die folgenden Dateiformate werden unterstützt.

Modell PDF Bild:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lesen Sie
Layout
Allgemeines Dokument
Vordefiniert
Benutzerdefinierte Extraktion
Benutzerdefinierte Klassifizierung
  • Fotos und Scans: Um optimale Ergebnisse zu erzielen, stellen Sie ein klares Foto oder eine qualitativ hochwertige Überprüfung pro Dokument bereit.
  • PDFs und TIFFs: Für PDFs und TIFFs können bis zu 2.000 Seiten verarbeitet werden. (Bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet.)
  • Dateigröße: Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
  • Bildabmessungen: Die Abmessungen müssen zwischen 50 Pixel x 50 Pixel und 10.000 Pixel x 10.000 Pixel betragen.
  • Kennwortsperrungen: Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
  • Texthöhe: Die minimale Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Dimension entspricht etwa 8 Punkt Text bei 150 Punkten pro Zoll.
  • Schulung für benutzerdefinierte Modelle: Die maximale Anzahl von Seiten für Schulungsdaten beträgt 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
  • Schulung des benutzerdefinierten Extraktionsmodells: Die Gesamtgröße der Schulungsdaten beträgt 50 MB für das Vorlagenmodell und 1 GB für das neurale Modell.
  • Schulung des benutzerdefinierten Klassifizierungsmodells: Die Gesamtgröße der Schulungsdaten beträgt 1 GB mit maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Schulungsdaten 2 GB mit maximal 10.000 Seiten.
  • Office-Dateitypen (DOCX, XLSX, PPTX):Die maximale Zeichenfolgenlängenbeschränkung beträgt 8 Millionen Zeichen.

Testen der Datenextraktion für Hypothekendokumente

Um zu sehen, wie die Datenextraktion für den Hypothekendokumentdienst funktioniert, benötigen Sie die folgenden Ressourcen:

  • Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunkt im Azure-Portal

Dokument Intelligenz Studio

  1. Wählen Sie auf der Startseite von Dokument Intelligenz Studio die Option Hypothek aus.

  2. Sie können die Muster-Hypothekendokumente analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:

    Screenshot der Schaltflächen „Analyse ausführen“ und „Analyseoptionen“ im Document Intelligence Studio.

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung ‒ vordefinierte Modelle.

Feldextraktion

Weitere Informationen zu unterstützten Feldern für die Dokumentextraktion finden Sie in unserem GitHub-Beispielrepository auf der Seite mit dem Modellschema für Hypothekendokumente.

Nächste Schritte