Model paragonu analizy dokumentów

Ta zawartość dotyczy:checkmarkwersja 4.0 (GA)Poprzednie wersje:niebieski znacznik wyboru v3.1 (GA) v3.0 (GA)niebieski znacznik wyboru v2.1 (GA)niebieski znacznik wyboru

Ta zawartość dotyczy:checkmarkwersja 3.1 (GA)Najnowsza wersja: wersja 4.0 (GA)Poprzednie wersje:purpurowy znacznik wyboruniebieski znacznik wyboruv3.0niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:Znacznikwersja 3.0 (GA) | Najnowsze wersje:purpurowy znacznik wyborupurple-checkmark v4.0 (GA) v3.1Poprzednia wersja:niebieski znacznik wyboruwersja 2.1

Ta zawartość dotyczy:ZnacznikNajnowsza wersja: | blue-checkmarkwersja 4.0 (OGÓLNA)

Model paragonu analizy dokumentów łączy zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania kluczowych informacji z paragonów sprzedaży. Paragony mogą mieć różne formaty i jakość, w tym paragony drukowane i odręczne. Interfejs API wyodrębnia kluczowe informacje, takie jak nazwa sprzedawcy, numer telefonu sprzedawcy, data transakcji, podatek i suma transakcji oraz zwraca ustrukturyzowane dane JSON. Model paragonów w wersji 4.0 (GA) obsługuje inne pola, w tym ReceiptType, TaxDetails.NetAmount, TaxDetails.DescriptionTaxDetails.Rate i CountryRegion wraz z wyodrębnianiem tabel VAT na ogólnych paragonach hotelowych.

Wyodrębnianie danych paragonu

Cyfryzacja paragonów obejmuje transformację różnych rodzajów paragonów, w tym zeskanowanych, sfotografowanych i drukowanych kopii w formacie cyfrowym w celu usprawnionego przetwarzania podrzędnego. Przykłady obejmują zarządzanie wydatkami, analizę zachowań konsumentów, automatyzację podatków itp. Korzystanie z analizy dokumentów z technologią optycznego rozpoznawania znaków (optycznego rozpoznawania znaków) umożliwia wyodrębnianie i interpretowanie danych z tych zróżnicowanych formatów paragonów. Przetwarzanie analizy dokumentów upraszcza proces konwersji, ale także znacznie skraca czas i nakład pracy, co ułatwia efektywne zarządzanie danymi i pobieranie.

Przykładowe potwierdzenie przetworzone za pomocą programu Document Intelligence Studio:

Przykładowe potwierdzenie przetworzone za pomocą narzędzia do etykietowania przykładowego analizy dokumentów:

Zrzut ekranu przedstawiający przykładowe potwierdzenie przetworzone za pomocą narzędzia do etykietowania przykładowego formularza.

Opcje programowania

Analiza dokumentów w wersji 4.0: 2024-11-30 (GA) obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja	Zasoby	Identyfikator modelu
Model paragonu	• Document Intelligence Studio REST API C# SDK • •	wstępnie utworzone potwierdzenie

Narzędzie Document Intelligence w wersji 3.1 obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja	Zasoby	Identyfikator modelu
Model paragonu	• Document Intelligence Studio REST API C# SDK • •	wstępnie utworzone potwierdzenie

Narzędzie Document Intelligence w wersji 3.0 obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja	Zasoby	Identyfikator modelu
Model paragonu	• Document Intelligence Studio REST API C# SDK • •	wstępnie utworzone potwierdzenie

Narzędzie Document Intelligence w wersji 2.1 obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja	Zasoby
Model paragonu	• do etykietowania analizy dokumentów• REST• biblioteki klienckiej•

Wymagania dotyczące danych wejściowych

Obsługiwane są następujące formaty plików.

Model	PDF	Obraz: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Przeczytaj	✔	✔	✔
Układ	✔	✔	✔
Dokument ogólny	✔	✔
Wstępnie utworzona	✔	✔
Niestandardowe wyodrębnianie	✔	✔
Klasyfikacja niestandardowa	✔	✔	✔

Zdjęcia i skanowania: Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
Pliki PDF i pliki TIFF: w przypadku plików PDF i plików TIFF można przetworzyć maksymalnie 2000 stron. (W przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko dwie pierwsze strony).
Rozmiar pliku: rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB dla warstwy bezpłatnej (F0).
Wymiary obrazu: Wymiary muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Blokady haseł: jeśli pliki PDF są zablokowane hasłem, należy usunąć blokadę przed przesłaniem.
Wysokość tekstu: minimalna wysokość tekstu do wyodrębnienia wynosi 12 pikseli dla obrazu 1024 x 768 pikseli. Ten rozmiar odpowiada około 8-punktowemu tekstowi przy 150 pikselach na cal.
Trenowanie modelu niestandardowego: maksymalna liczba stron dla danych szkoleniowych to 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
Trenowanie niestandardowego modelu wyodrębniania: całkowity rozmiar danych treningowych wynosi 50 MB dla modelu wzorcowego i 1 GB dla modelu neuronowego.
Szkolenie niestandardowego modelu klasyfikacji: całkowity rozmiar danych treningowych wynosi 1 GB, maksymalnie do 10 000 stron. W przypadku wersji 2024-11-30 (GA) całkowity rozmiar danych treningowych wynosi 2 GB z maksymalnie 10 000 stron.
Typy plików pakietu Office (DOCX, XLSX, PPTX): Maksymalny limit długości ciągu wynosi 8 milionów znaków.

Obsługiwane formaty plików: JPEG, PNG, PDF i TIFF.
Obsługiwany limit stron dla plików PDF i TIFF: Analiza dokumentów może przetwarzać maksymalnie 2000 stron dla subskrybentów warstwy Standardowa lub tylko dwie pierwsze strony dla subskrybentów warstwy bezpłatnie.
Obsługiwany rozmiar pliku: mniejszy niż 50 MB; minimalna liczba pikseli 50 x 50 pikseli; maksymalna liczba pikseli: 10 000 x 10 000 pikseli.

Wyodrębnianie danych modelu paragonu

Zobacz, w jaki sposób analiza dokumentów wyodrębnia dane, w tym godzinę i datę transakcji, informacje o kupcu i sumy kwot od wpływów. Potrzebne są następujące zasoby:

Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.

Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

Uwaga

Program Document Intelligence Studio jest dostępny z interfejsami API w wersji 3.1 i 3.0 oraz nowszymi wersjami.

Na stronie głównej Document Intelligence Studio wybierz pozycję Paragony.
Możesz przeanalizować przykładowe potwierdzenie lub przekazać własne pliki.
Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:

Wypróbuj narzędzie Document Intelligence Studio.

Narzędzie do etykietowania przykładowego analizy dokumentów

Przejdź do narzędzia przykładowego analizy dokumentów.
Na stronie głównej przykładowego narzędzia wybierz kafelek Użyj wstępnie utworzonego modelu, aby pobrać dane .
Wybierz typ formularza do przeanalizowania z menu rozwijanego.
Wybierz adres URL pliku, który chcesz przeanalizować z poniższych opcji:
- Przykładowy dokument faktury.
- Przykładowy dokument o identyfikatorze.
- Przykładowy obraz potwierdzenia.
- Przykładowy obraz wizytówki.
W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej wybrany adres URL i wybierz przycisk Pobierz.
W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.
W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.
Wybierz pozycję Uruchom analizę. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje interfejs API analizy wstępnie utworzonej i analizuje dokument.
Wyświetl wyniki — zobacz wyodrębnione pary klucz-wartość, elementy wiersza, wyróżniony tekst wyodrębniony i wykryte tabele.

Uwaga

Przykładowe narzędzie etykietowania nie obsługuje formatu pliku BMP. Jest to ograniczenie narzędzia, a nie usługi analizy dokumentów.

Obsługiwane języki i ustawienia regionalne

Aby uzyskać pełną listę obsługiwanych języków, zobacz naszą wstępnie utworzoną stronę obsługi języka modeli.

Wyodrębnianie pól

W przypadku obsługiwanych pól wyodrębniania dokumentów zapoznaj się ze stroną schematu modelu paragonów w naszym repozytorium przykładowym GitHub

Nazwisko	Typ	Opis	Standardowe dane wyjściowe
Typ paragonu	String	Typ paragonu sprzedaży	Wyszczególnione
Nazwa handlowca	String	Imię i nazwisko sprzedawcy wystawiającego paragon
Numer MerchantPhone	phoneNumber	Wymieniony numer telefonu sprzedawcy	+1 xxx xxx xxxx
Adres handlowca	String	Wymieniony adres sprzedawcy
Data transakcji	Data	Data wystawienia paragonu	rrrr-mm-dd
Czas transakcji	Czas	Czas wystawienia paragonu	hh-mm-ss (24-godzinne)
Łącznie	Liczba (USD)	Całkowita liczba transakcji odbioru	Liczba zmiennoprzecinkowa dwuprzecinkowa
Suma częściowa	Liczba (USD)	Suma częściowa paragonu, często przed zastosowaniem podatków	Liczba zmiennoprzecinkowa dwuprzecinkowa
Podatek	Liczba (USD)	Całkowity podatek od paragonu (często podatek od sprzedaży lub odpowiednik). Zmieniono nazwę na "TotalTax" w wersji 2022-06-30.	Liczba zmiennoprzecinkowa dwuprzecinkowa
Napiwek	Liczba (USD)	Porada dołączona przez kupującego	Liczba zmiennoprzecinkowa dwuprzecinkowa
Elementy	Tablica obiektów	Wyodrębnione elementy wiersza z nazwą, ilością, ceną jednostkową i łączną ceną wyodrębnionej
Nazwisko	String	Opis elementu. Zmieniono nazwę na "Opis" w wersji 2022-06-30.
Ilość	Liczba	Ilość każdego elementu	Liczba zmiennoprzecinkowa dwuprzecinkowa
Cena	Liczba	Pojedyncza cena każdej jednostki przedmiotów	Liczba zmiennoprzecinkowa dwuprzecinkowa
Cena_łączna	Liczba	Łączna cena elementu wiersza	Liczba zmiennoprzecinkowa dwuprzecinkowa

Przewodnik migracji i interfejs API REST w wersji 3.1

Postępuj zgodnie z naszym przewodnikiem migracji do analizy dokumentów w wersji 3.1, aby dowiedzieć się, jak używać wersji 3.1 w aplikacjach i przepływach pracy.

Następne kroki

Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.

Znajdź więcej przykładów w witrynie GitHub.

Znajdź więcej przykładów w witrynie GitHub.

Spróbuj przetwarzać własne formularze i dokumenty za pomocą narzędzia do etykietowania przykładowego analizy dokumentów.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-11-18