Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Model oświadczenia bankowego analizy dokumentów łączy zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania danych z amerykańskich oświadczeń bankowych. Interfejs API analizuje drukowane wyciągi bankowe; wyodrębnia kluczowe informacje, takie jak numer konta, szczegóły banku, szczegóły zestawienia, szczegóły transakcji i opłaty; funkcja zwraca ustrukturyzowaną reprezentację danych JSON. W wersji 4.0 ogólnie dostępnej można teraz wyodrębnić tabele kontrolne w amerykańskich instrukcjach bankowych.
| Funkcja | wersja | Identyfikator modelu |
|---|---|---|
| Model zestawienia bankowego | Wersja 4.0: 2024-11-30 (ogólna dostępność) | prebuilt-bankStatement.us |
Wyodrębnianie danych z zestawienia bankowego
Wyciąg bankowy pomaga przejrzeć działania konta w określonym przedziale czasu. Jest to oficjalne oświadczenie, które pomaga wykrywać oszustwa, śledzić wydatki, błędy księgowe i rejestrować działania okresu. Zobacz, jak dane są wyodrębniane przy użyciu prebuilt-bankStatement.us modelu. Potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz bezpłatnie utworzyć subskrypcję platformy Azure
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Document Intelligence Studio
Na stronie głównej Document Intelligence Studio wybierz pozycję wyciągi bankowe.
Możesz przeanalizować przykładową instrukcję bankową lub przekazać własne pliki.
Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:
Wymagania dotyczące danych wejściowych
Obsługiwane są następujące formaty plików.
| Model | Obraz: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Przeczytaj | ✔ | ✔ | ✔ |
| Układ | ✔ | ✔ | ✔ |
| Dokument ogólny | ✔ | ✔ | |
| Wstępnie utworzona | ✔ | ✔ | |
| Niestandardowe wyodrębnianie | ✔ | ✔ | |
| Klasyfikacja niestandardowa | ✔ | ✔ | ✔ |
- Zdjęcia i skanowania: Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
- Pliki PDF i pliki TIFF: w przypadku plików PDF i plików TIFF można przetworzyć maksymalnie 2000 stron. (W przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko dwie pierwsze strony).
- Rozmiar pliku: rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB dla warstwy bezpłatnej (F0).
- Wymiary obrazu: Wymiary muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
- Blokady haseł: jeśli pliki PDF są zablokowane hasłem, należy usunąć blokadę przed przesłaniem.
- Wysokość tekstu: minimalna wysokość tekstu do wyodrębnienia wynosi 12 pikseli dla obrazu 1024 x 768 pikseli. Ten wymiar odpowiada około 8-punktowemu tekstowi na 150 kropek na cal.
- Trenowanie modelu niestandardowego: maksymalna liczba stron dla danych szkoleniowych to 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
- Trenowanie niestandardowego modelu wyodrębniania: całkowity rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1 GB dla modelu neuronowego.
- Trenowanie niestandardowego modelu klasyfikacji: całkowity rozmiar danych treningowych wynosi 1 GB z maksymalnie 10 000 stron. W przypadku wersji 2024-11-30 (GA) całkowity rozmiar danych treningowych wynosi 2 GB z maksymalnie 10 000 stron.
- Typy plików pakietu Office (DOCX, XLSX, PPTX): Maksymalny limit długości ciągu wynosi 8 milionów znaków.
Obsługiwane języki i ustawienia regionalne
Aby uzyskać pełną listę obsługiwanych języków, zobacz naszą wstępnie utworzoną stronę obsługi języka modelu.
Wyodrębnianie pól
Aby uzyskać informacje o obsługiwanych polach wyodrębniania dokumentów, zobacz stronę schematu modelu instrukcji bankowych w naszym przykładowym repozytorium GitHub.
Obsługiwane ustawienia regionalne
Prebuilt-bankStatement.us w wersji 2027-11-30 obsługuje ustawienia regionalne en-us.
Następne kroki
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.