Model dokumentu identyfikatora analizy dokumentów

Ta zawartość dotyczy:checkmarkwersja 4.0 (GA)Poprzednie wersje:niebieski znacznik wyboru v3.1 (GA) v3.0 (GA)niebieski znacznik wyboru v2.1 (GA)niebieski znacznik wyboru

::: moniker-end

Ta zawartość dotyczy:checkmarkwersja 3.1 (GA)Najnowsza wersja: wersja 4.0 (GA)Poprzednie wersje:purpurowy znacznik wyboruniebieski znacznik wyboruv3.0niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:Znacznikwersja 3.0 (GA) | Najnowsze wersje:purpurowy znacznik wyborupurple-checkmark v4.0 (GA) v3.1Poprzednia wersja:niebieski znacznik wyboruwersja 2.1

Ta zawartość dotyczy:ZnacznikNajnowsza wersja: | blue-checkmarkwersja 4.0 (OGÓLNA)

Note

Interfejs API analizy v4.0 2024-11-30 (GA) dokumentów dla wstępnie utworzonego modelu dokumentu tożsamości (ID) obsługuje teraz dokumenty identyfikacyjne ze wszystkich regionów na całym świecie, w tym rozszerzone pokrycie w Ameryce Północnej, Ameryce Południowej, Azji, Europie, Afryce i Oceanii.

Model dokumentów tożsamości analizy dokumentów (ID) łączy optyczne rozpoznawanie znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania kluczowych informacji z dokumentów tożsamości. Interfejs API analizuje dokumenty tożsamości (w tym następujące) i zwraca ustrukturyzowaną reprezentację danych JSON.

Region	Typy dokumentów
Worldwide	Książka paszportowa, karta paszportowa
Stany Zjednoczone	Prawo jazdy, karty identyfikacyjnej, zezwolenia na pobyt (zielona karta), karty ubezpieczenia społecznego, identyfikatora wojskowego
India	Prawo jazdy, KARTA PAN, Aadhaar Card
Australia	Licencja kierowcy, karta fotograficzna, identyfikator klucza (w tym wersja cyfrowa)
Pozostałe	Prawo jazdy, karta identyfikacji, zezwolenie na pobyt

Analiza dokumentów może analizować i wyodrębniać informacje z dokumentów identyfikacyjnych wystawionych przez instytucje rządowe przy użyciu wstępnie utworzonego modelu identyfikatorów. Łączy nasze zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z funkcjami rozpoznawania identyfikatorów, aby wyodrębnić kluczowe informacje z światowych paszportów i licencji kierowców USA (wszystkie 50 stanów i DC). Interfejs API identyfikatorów wyodrębnia kluczowe informacje z tych dokumentów tożsamości, takich jak imię, nazwisko, data urodzenia, numer dokumentu i inne. Ten interfejs API jest dostępny w usłudze Document Intelligence w wersji 2.1 jako usługi w chmurze.

Przetwarzanie dokumentów tożsamości

Przetwarzanie dokumentów tożsamości obejmuje wyodrębnianie danych z dokumentów tożsamości ręcznie lub przy użyciu technologii OCR. Przetwarzanie dokumentów identyfikatorów to ważny krok w każdej operacji biznesowej, która wymaga potwierdzenia tożsamości. Przykłady obejmują weryfikację klienta w bankach i innych instytucjach finansowych, wniosków hipotecznych, wizyt medycznych, przetwarzania roszczeń, branży hotelarskiej i nie tylko. Osoby fizyczne dostarczają pewne dowody tożsamości za pośrednictwem licencji, paszportów i innych podobnych dokumentów, aby firma mogła skutecznie je zweryfikować przed świadczeniem usług i świadczeń.

Przykładowa licencja kierowcy USA przetworzona w usłudze Document Intelligence Studio

Obraz przedstawiający przykładową licencję kierowcy.

Wyodrębnianie danych

Wstępnie utworzona usługa identyfikatorów wyodrębnia wartości kluczy z światowych paszportów i licencji kierowców USA i zwraca je w zorganizowanej ustrukturyzowanej odpowiedzi JSON.

Przykład licencji kierowcy

Przykładowa licencja kierowcy

Przykład usługi Passport

Przykładowy paszport

Opcje programowania

Analiza dokumentów w wersji 4.0: 2024-11-30 (GA) obsługuje następujące narzędzia, aplikacje i biblioteki:

Feature	Resources	Identyfikator modelu
Model dokumentu identyfikatora	• Document Intelligence Studio REST API C# SDK • •	prebuilt-idDocument

Narzędzie Document Intelligence w wersji 3.1 obsługuje następujące narzędzia, aplikacje i biblioteki:

Feature	Resources	Identyfikator modelu
Model dokumentu identyfikatora	• Document Intelligence Studio REST API C# SDK • •	prebuilt-idDocument

Narzędzie Document Intelligence w wersji 3.0 obsługuje następujące narzędzia, aplikacje i biblioteki:

Feature	Resources	Identyfikator modelu
Model dokumentu identyfikatora	• Document Intelligence Studio REST API C# SDK • •	prebuilt-idDocument

Narzędzie Document Intelligence w wersji 2.1 obsługuje następujące narzędzia, aplikacje i biblioteki:

Feature	Resources
Model dokumentu identyfikatora	• do etykietowania analizy dokumentów• REST• biblioteki klienckiej•

Wymagania dotyczące danych wejściowych

Obsługiwane są następujące formaty plików.

Model	PDF	Obraz: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Read	✔	✔	✔
Układ	✔	✔	✔
Dokument ogólny	✔	✔
Prebuilt	✔	✔
Wyodrębnianie niestandardowe	✔	✔
Klasyfikacja niestandardowa	✔	✔	✔

Zdjęcia i skanowania: Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
Pliki PDF i pliki TIFF: w przypadku plików PDF i plików TIFF można przetworzyć maksymalnie 2000 stron. (W przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko dwie pierwsze strony).
Rozmiar pliku: rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB dla warstwy bezpłatnej (F0).
Wymiary obrazu: Wymiary muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Blokady haseł: jeśli pliki PDF są zablokowane hasłem, należy usunąć blokadę przed przesłaniem.
Wysokość tekstu: minimalna wysokość tekstu do wyodrębnienia wynosi 12 pikseli dla obrazu 1024 x 768 pikseli. Ten wymiar odpowiada około 8-punktowemu tekstowi na 150 kropek na cal.
Trenowanie modelu niestandardowego: maksymalna liczba stron dla danych szkoleniowych to 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
Trenowanie niestandardowego modelu wyodrębniania: całkowity rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1 GB dla modelu neuronowego.
Trenowanie niestandardowego modelu klasyfikacji: całkowity rozmiar danych treningowych wynosi 1 GB z maksymalnie 10 000 stron. W przypadku wersji 2024-11-30 (GA) całkowity rozmiar danych treningowych wynosi 2 GB z maksymalnie 10 000 stron.
Typy plików pakietu Office (DOCX, XLSX, PPTX): Maksymalny limit długości ciągu wynosi 8 milionów znaków.

Obsługiwane formaty plików: JPEG, PNG, PDF i TIFF.
Obsługiwana liczba stron dla plików PDF i TIFF: maksymalnie 2000 stron lub tylko dwie pierwsze strony dla subskrybentów warstwy bezpłatna.
Obsługiwany rozmiar pliku: mniej niż 50 MB ŁĄCZNIE; minimalna liczba pikseli: 50 x 50 pikseli; maksymalna liczba pikseli: 10 000 x 10 000 pikseli.

Wyodrębnianie danych modelu dokumentów identyfikatorów

Wyodrębnij dane, w tym nazwę, datę urodzenia i datę wygaśnięcia z dokumentów identyfikatorów. Potrzebne są następujące zasoby:

Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.

Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

Note

Program Document Intelligence Studio jest dostępny z interfejsami API w wersji 3.1 i 3.0 oraz nowszymi wersjami.

Na stronie głównej programu Document Intelligence Studio wybierz pozycję Dokumenty tożsamości.
Możesz przeanalizować przykładową fakturę lub przekazać własne pliki.
Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:

Wypróbuj narzędzie Document Intelligence Studio.

Narzędzie do etykietowania przykładowego analizy dokumentów

Przejdź do narzędzia przykładowego analizy dokumentów.
Na stronie głównej przykładowego narzędzia wybierz kafelek Użyj wstępnie utworzonego modelu, aby pobrać dane .
Wybierz typ formularza do przeanalizowania z menu rozwijanego.
Wybierz adres URL pliku, który chcesz przeanalizować z poniższych opcji:
- Przykładowy dokument faktury.
- Przykładowy dokument o identyfikatorze.
- Przykładowy obraz potwierdzenia.
- Przykładowy obraz wizytówki.
W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej wybrany adres URL i wybierz przycisk Pobierz.
W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.
W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.
Wybierz pozycję Uruchom analizę. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje interfejs API analizy wstępnie utworzonej i analizuje dokument.
Wyświetl wyniki — zobacz wyodrębnione pary klucz-wartość, elementy wiersza, wyróżniony tekst wyodrębniony i wykryte tabele.
Pobierz plik wyjściowy JSON, aby wyświetlić szczegółowe wyniki.
- Węzeł "readResults" zawiera każdy wiersz tekstu z odpowiednim umieszczeniem pola ograniczenia na stronie.
- Węzeł "selectionMarks" pokazuje każdy znacznik zaznaczenia (pole wyboru, znacznik radiowy) i określa, czy jego stan jest zaznaczony , czy niezaznaczony.
- Sekcja "pageResults" zawiera wyodrębnione tabele. Dla każdej tabeli analiza dokumentów wyodrębnia tekst, wiersz i indeks kolumn, zakres wierszy i kolumn, pole ograniczenia i nie tylko.
- Pole "documentResults" zawiera informacje o parach klucz/wartość i informacje o elementach wiersza dla najbardziej odpowiednich części dokumentu.

Note

Narzędzie Do etykietowania przykładowego nie obsługuje formatu pliku BMP. To ograniczenie jest ograniczeniem narzędzia, a nie usługi analizy dokumentów.

Wyodrębnianie pól

Aby uzyskać informacje o obsługiwanych polach wyodrębniania dokumentów, zobacz stronę schematu modelu dokumentów identyfikatorów w naszym przykładowym repozytorium GitHub.

Obsługiwane typy dokumentu

Model dokumentu ID obsługuje obecnie amerykańskie licencje kierowców i stronę biograficzną z międzynarodowych paszportów (z wyłączeniem wiz i innych dokumentów podróży) wyodrębniania.

Wyodrębnione pola

Name	Typ	Description	Value
Country	country	Kod kraju zgodny ze standardem ISO 3166	"USA"
DateOfBirth	date	DOB w formacie RRRR-MM-DD	"1980-01-01"
DateOfExpiration	date	Data wygaśnięcia w formacie RRRR-MM-DD	"2019-05-05"
DocumentNumber	ciąg	Odpowiedni numer paszportu, numer licencji kierowcy itp.	"340020013"
FirstName	ciąg	Wyodrębnione imię i środkowe inicjały, jeśli ma to zastosowanie	"JENNIFER"
LastName	ciąg	Wyodrębnione nazwisko	"BROOKS"
Nationality	country	Kod kraju zgodny ze standardem ISO 3166	"USA"
Sex	gender	Możliwe wyodrębnione wartości obejmują "M" "F" "X"	"F"
MachineReadableZone	obiekt	Wyodrębniony paszport `MRZ` zawierający dwa wiersze z 44 znakami	"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307 715816<"
DocumentType	ciąg	Typ dokumentu, na przykład Paszport, Licencja kierowcy	"passport"
Address	ciąg	Wyodrębniony adres (tylko prawo jazdy)	"123 ULICA ADRES TWOJE MIASTO WOJ 99999-1234"
Region	ciąg	Wyodrębniony region, stan, prowincja itp. (tylko prawo jazdy)	"Washington"

Przewodnik migracji

Postępuj zgodnie z naszym przewodnikiem migracji do analizy dokumentów w wersji 3.1, aby dowiedzieć się, jak używać wersji 3.0 w aplikacjach i przepływach pracy.

Dalsze kroki

Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.

Znajdź więcej przykładów w witrynie GitHub.

Znajdź więcej przykładów w witrynie GitHub.

Spróbuj przetwarzać własne formularze i dokumenty za pomocą narzędzia do etykietowania przykładowego analizy dokumentów.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-11-18

Udostępnij przez

Model dokumentu identyfikatora analizy dokumentów

Przetwarzanie dokumentów tożsamości

Wyodrębnianie danych

Przykład licencji kierowcy

Przykład usługi Passport

Opcje programowania

Wymagania dotyczące danych wejściowych

Wyodrębnianie danych modelu dokumentów identyfikatorów

Narzędzie do etykietowania przykładowego analizy dokumentów

Wyodrębnianie pól

Obsługiwane typy dokumentu

Wyodrębnione pola

Przewodnik migracji

Dalsze kroki

Sprzężenie zwrotne

Dodatkowe źródła