Udostępnij przez


Modele dokumentów hipotecznych analizy dokumentów

Ta zawartość dotyczy:Znacznikwersja 4.0 (ogólna dostępność)

Modele kredytów hipotecznych analizy dokumentów wykorzystują zaawansowane funkcje optycznego rozpoznawania znaków (OCR) i modeli uczenia głębokiego do analizowania i wyodrębniania kluczowych pól z dokumentów hipotecznych. Dokumenty hipoteczne mogą mieć różne formaty i jakość. Interfejs API analizuje dokumenty hipoteczne i zwraca ustrukturyzowaną reprezentację danych JSON. Modele obsługują obecnie tylko dokumenty w języku angielskim. Dzięki najnowszej wersji 4.0 można teraz wyodrębnić podpisy z wniosków o kredyt hipoteczny i formularze.

Obsługiwane typy dokumentów:

  • Jednolity wniosek o pożyczkę mieszkaniową (formularz 1003)
  • Jednolity raport oceny mieszkaniowej (formularz 1004)
  • Weryfikacja formularza zatrudnienia (formularz 1005)
  • Uniform Underwriting and Transmital Summary (Formularz 1008)
  • Formularz ujawnienia zamykającego

Opcje programowania

Analiza dokumentów w wersji 4.0 (2024-11-30-GA) obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby Identyfikator modelu
Model kredytów hipotecznych • Document Intelligence Studio REST API
C# SDK
• prebuilt-mortgage.us.1003
• prebuilt-mortgage.us.1004
• prebuilt-mortgage.us.1005
• prebuilt-mortgage.us.1008
• prebuilt-mortgage.us.closingDisclosure

Wymagania dotyczące danych wejściowych

Obsługiwane są następujące formaty plików.

Model PDF Obraz:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Przeczytaj
Układ
Dokument ogólny
Wstępnie utworzona
Niestandardowe wyodrębnianie
Klasyfikacja niestandardowa
  • Zdjęcia i skanowania: Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
  • Pliki PDF i pliki TIFF: w przypadku plików PDF i plików TIFF można przetworzyć maksymalnie 2000 stron. (W przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko dwie pierwsze strony).
  • Rozmiar pliku: rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB dla warstwy bezpłatnej (F0).
  • Wymiary obrazu: Wymiary muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
  • Blokady haseł: jeśli pliki PDF są zablokowane hasłem, należy usunąć blokadę przed przesłaniem.
  • Wysokość tekstu: minimalna wysokość tekstu do wyodrębnienia wynosi 12 pikseli dla obrazu 1024 x 768 pikseli. Ten wymiar odpowiada około 8-punktowemu tekstowi na 150 kropek na cal.
  • Trenowanie modelu niestandardowego: maksymalna liczba stron dla danych szkoleniowych to 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
  • Trenowanie niestandardowego modelu wyodrębniania: całkowity rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1 GB dla modelu neuronowego.
  • Trenowanie niestandardowego modelu klasyfikacji: całkowity rozmiar danych treningowych wynosi 1 GB z maksymalnie 10 000 stron. W przypadku wersji 2024-11-30 (GA) całkowity rozmiar danych treningowych wynosi 2 GB z maksymalnie 10 000 stron.
  • Typy plików pakietu Office (DOCX, XLSX, PPTX): Maksymalny limit długości ciągu wynosi 8 milionów znaków.

Wypróbuj wyodrębnianie danych dokumentów hipotecznych

Aby zobaczyć, jak działa wyodrębnianie danych dla usługi dokumentów hipotecznych, potrzebne są następujące zasoby:

  • Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.

  • Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.

Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

Document Intelligence Studio

  1. Na stronie głównej Document Intelligence Studio wybierz pozycję Kredyt hipoteczny.

  2. Możesz przeanalizować przykładowe dokumenty hipoteczne lub przekazać własne pliki.

  3. Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:

    Zrzut ekranu przedstawiający przyciski Run analysis and Analyze (Uruchamianie analizy i analizowanie) w narzędziu Document Intelligence Studio.

Obsługiwane języki i ustawienia regionalne

Zobacz naszą stronę Obsługa języków — wstępnie utworzone modele , aby uzyskać pełną listę obsługiwanych języków.

Wyodrębnianie pól

Aby uzyskać informacje o obsługiwanych polach wyodrębniania dokumentów, zobacz strony schematu modelu dokumentów hipotecznych w naszym przykładowym repozytorium GitHub.

Następne kroki