Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ta zawartość dotyczy:checkmarkwersja 4.0 (GA)Poprzednie wersje:niebieski znacznik wyboru v3.1 (GA) v3.0 (GA)niebieski znacznik wyboru v2.1 (GA)niebieski znacznik wyboru
::: moniker-end
Ta zawartość dotyczy:checkmarkwersja 3.1 (GA)Najnowsza wersja: wersja 4.0 (GA)Poprzednie wersje:purpurowy znacznik wyboruniebieski znacznik wyboruv3.0niebieski znacznik wyboruv2.1
Ta zawartość dotyczy:
Znacznikwersja 3.0 (GA) | Najnowsze wersje:purpurowy znacznik wyboru
purple-checkmark v4.0 (GA) v3.1Poprzednia wersja:niebieski znacznik wyboruwersja 2.1
Ta zawartość dotyczy:
ZnacznikNajnowsza wersja: | blue-checkmarkwersja 4.0 (OGÓLNA)
Note
Interfejs API analizy v4.0 2024-11-30 (GA) dokumentów dla wstępnie utworzonego modelu dokumentu tożsamości (ID) obsługuje teraz dokumenty identyfikacyjne ze wszystkich regionów na całym świecie, w tym rozszerzone pokrycie w Ameryce Północnej, Ameryce Południowej, Azji, Europie, Afryce i Oceanii.
Model dokumentów tożsamości analizy dokumentów (ID) łączy optyczne rozpoznawanie znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania kluczowych informacji z dokumentów tożsamości. Interfejs API analizuje dokumenty tożsamości (w tym następujące) i zwraca ustrukturyzowaną reprezentację danych JSON.
| Region | Typy dokumentów |
|---|---|
| Worldwide | Książka paszportowa, karta paszportowa |
| Stany Zjednoczone | Prawo jazdy, karty identyfikacyjnej, zezwolenia na pobyt (zielona karta), karty ubezpieczenia społecznego, identyfikatora wojskowego |
| India | Prawo jazdy, KARTA PAN, Aadhaar Card |
| Australia | Licencja kierowcy, karta fotograficzna, identyfikator klucza (w tym wersja cyfrowa) |
| Pozostałe | Prawo jazdy, karta identyfikacji, zezwolenie na pobyt |
Analiza dokumentów może analizować i wyodrębniać informacje z dokumentów identyfikacyjnych wystawionych przez instytucje rządowe przy użyciu wstępnie utworzonego modelu identyfikatorów. Łączy nasze zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z funkcjami rozpoznawania identyfikatorów, aby wyodrębnić kluczowe informacje z światowych paszportów i licencji kierowców USA (wszystkie 50 stanów i DC). Interfejs API identyfikatorów wyodrębnia kluczowe informacje z tych dokumentów tożsamości, takich jak imię, nazwisko, data urodzenia, numer dokumentu i inne. Ten interfejs API jest dostępny w usłudze Document Intelligence w wersji 2.1 jako usługi w chmurze.
Przetwarzanie dokumentów tożsamości
Przetwarzanie dokumentów tożsamości obejmuje wyodrębnianie danych z dokumentów tożsamości ręcznie lub przy użyciu technologii OCR. Przetwarzanie dokumentów identyfikatorów to ważny krok w każdej operacji biznesowej, która wymaga potwierdzenia tożsamości. Przykłady obejmują weryfikację klienta w bankach i innych instytucjach finansowych, wniosków hipotecznych, wizyt medycznych, przetwarzania roszczeń, branży hotelarskiej i nie tylko. Osoby fizyczne dostarczają pewne dowody tożsamości za pośrednictwem licencji, paszportów i innych podobnych dokumentów, aby firma mogła skutecznie je zweryfikować przed świadczeniem usług i świadczeń.
Przykładowa licencja kierowcy USA przetworzona w usłudze Document Intelligence Studio
Wyodrębnianie danych
Wstępnie utworzona usługa identyfikatorów wyodrębnia wartości kluczy z światowych paszportów i licencji kierowców USA i zwraca je w zorganizowanej ustrukturyzowanej odpowiedzi JSON.
Przykład licencji kierowcy
Przykład usługi Passport
Opcje programowania
Analiza dokumentów w wersji 4.0: 2024-11-30 (GA) obsługuje następujące narzędzia, aplikacje i biblioteki:
| Feature | Resources | Identyfikator modelu |
|---|---|---|
| Model dokumentu identyfikatora | • Document Intelligence Studio REST API C# SDK • • |
prebuilt-idDocument |
Narzędzie Document Intelligence w wersji 3.1 obsługuje następujące narzędzia, aplikacje i biblioteki:
| Feature | Resources | Identyfikator modelu |
|---|---|---|
| Model dokumentu identyfikatora | • Document Intelligence Studio REST API C# SDK • • |
prebuilt-idDocument |
Narzędzie Document Intelligence w wersji 3.0 obsługuje następujące narzędzia, aplikacje i biblioteki:
| Feature | Resources | Identyfikator modelu |
|---|---|---|
| Model dokumentu identyfikatora | • Document Intelligence Studio REST API C# SDK • • |
prebuilt-idDocument |
Narzędzie Document Intelligence w wersji 2.1 obsługuje następujące narzędzia, aplikacje i biblioteki:
| Feature | Resources |
|---|---|
| Model dokumentu identyfikatora | • do etykietowania analizy dokumentów• REST• biblioteki klienckiej• |
Wymagania dotyczące danych wejściowych
Obsługiwane są następujące formaty plików.
| Model | Obraz: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Read | ✔ | ✔ | ✔ |
| Układ | ✔ | ✔ | ✔ |
| Dokument ogólny | ✔ | ✔ | |
| Prebuilt | ✔ | ✔ | |
| Wyodrębnianie niestandardowe | ✔ | ✔ | |
| Klasyfikacja niestandardowa | ✔ | ✔ | ✔ |
- Zdjęcia i skanowania: Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
- Pliki PDF i pliki TIFF: w przypadku plików PDF i plików TIFF można przetworzyć maksymalnie 2000 stron. (W przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko dwie pierwsze strony).
- Rozmiar pliku: rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB dla warstwy bezpłatnej (F0).
- Wymiary obrazu: Wymiary muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
- Blokady haseł: jeśli pliki PDF są zablokowane hasłem, należy usunąć blokadę przed przesłaniem.
- Wysokość tekstu: minimalna wysokość tekstu do wyodrębnienia wynosi 12 pikseli dla obrazu 1024 x 768 pikseli. Ten wymiar odpowiada około 8-punktowemu tekstowi na 150 kropek na cal.
- Trenowanie modelu niestandardowego: maksymalna liczba stron dla danych szkoleniowych to 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
- Trenowanie niestandardowego modelu wyodrębniania: całkowity rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1 GB dla modelu neuronowego.
- Trenowanie niestandardowego modelu klasyfikacji: całkowity rozmiar danych treningowych wynosi 1 GB z maksymalnie 10 000 stron. W przypadku wersji 2024-11-30 (GA) całkowity rozmiar danych treningowych wynosi 2 GB z maksymalnie 10 000 stron.
- Typy plików pakietu Office (DOCX, XLSX, PPTX): Maksymalny limit długości ciągu wynosi 8 milionów znaków.
Obsługiwane formaty plików: JPEG, PNG, PDF i TIFF.
Obsługiwana liczba stron dla plików PDF i TIFF: maksymalnie 2000 stron lub tylko dwie pierwsze strony dla subskrybentów warstwy bezpłatna.
Obsługiwany rozmiar pliku: mniej niż 50 MB ŁĄCZNIE; minimalna liczba pikseli: 50 x 50 pikseli; maksymalna liczba pikseli: 10 000 x 10 000 pikseli.
Wyodrębnianie danych modelu dokumentów identyfikatorów
Wyodrębnij dane, w tym nazwę, datę urodzenia i datę wygaśnięcia z dokumentów identyfikatorów. Potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Note
Program Document Intelligence Studio jest dostępny z interfejsami API w wersji 3.1 i 3.0 oraz nowszymi wersjami.
Narzędzie do etykietowania przykładowego analizy dokumentów
Przejdź do narzędzia przykładowego analizy dokumentów.
Na stronie głównej przykładowego narzędzia wybierz kafelek Użyj wstępnie utworzonego modelu, aby pobrać dane .
Wybierz typ formularza do przeanalizowania z menu rozwijanego.
Wybierz adres URL pliku, który chcesz przeanalizować z poniższych opcji:
- Przykładowy dokument faktury.
- Przykładowy dokument o identyfikatorze.
- Przykładowy obraz potwierdzenia.
- Przykładowy obraz wizytówki.
W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej wybrany adres URL i wybierz przycisk Pobierz.
W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.
W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.
Wybierz pozycję Uruchom analizę. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje interfejs API analizy wstępnie utworzonej i analizuje dokument.
Wyświetl wyniki — zobacz wyodrębnione pary klucz-wartość, elementy wiersza, wyróżniony tekst wyodrębniony i wykryte tabele.
Pobierz plik wyjściowy JSON, aby wyświetlić szczegółowe wyniki.
- Węzeł "readResults" zawiera każdy wiersz tekstu z odpowiednim umieszczeniem pola ograniczenia na stronie.
- Węzeł "selectionMarks" pokazuje każdy znacznik zaznaczenia (pole wyboru, znacznik radiowy) i określa, czy jego stan jest zaznaczony , czy niezaznaczony.
- Sekcja "pageResults" zawiera wyodrębnione tabele. Dla każdej tabeli analiza dokumentów wyodrębnia tekst, wiersz i indeks kolumn, zakres wierszy i kolumn, pole ograniczenia i nie tylko.
- Pole "documentResults" zawiera informacje o parach klucz/wartość i informacje o elementach wiersza dla najbardziej odpowiednich części dokumentu.
Wyodrębnianie pól
Aby uzyskać informacje o obsługiwanych polach wyodrębniania dokumentów, zobacz stronę schematu modelu dokumentów identyfikatorów w naszym przykładowym repozytorium GitHub.
Obsługiwane typy dokumentu
Model dokumentu ID obsługuje obecnie amerykańskie licencje kierowców i stronę biograficzną z międzynarodowych paszportów (z wyłączeniem wiz i innych dokumentów podróży) wyodrębniania.
Wyodrębnione pola
| Name | Typ | Description | Value |
|---|---|---|---|
| Country | country | Kod kraju zgodny ze standardem ISO 3166 | "USA" |
| DateOfBirth | date | DOB w formacie RRRR-MM-DD | "1980-01-01" |
| DateOfExpiration | date | Data wygaśnięcia w formacie RRRR-MM-DD | "2019-05-05" |
| DocumentNumber | ciąg | Odpowiedni numer paszportu, numer licencji kierowcy itp. | "340020013" |
| FirstName | ciąg | Wyodrębnione imię i środkowe inicjały, jeśli ma to zastosowanie | "JENNIFER" |
| LastName | ciąg | Wyodrębnione nazwisko | "BROOKS" |
| Nationality | country | Kod kraju zgodny ze standardem ISO 3166 | "USA" |
| Sex | gender | Możliwe wyodrębnione wartości obejmują "M" "F" "X" | "F" |
| MachineReadableZone | obiekt | Wyodrębniony paszport MRZ zawierający dwa wiersze z 44 znakami |
"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307 715816<" |
| DocumentType | ciąg | Typ dokumentu, na przykład Paszport, Licencja kierowcy | "passport" |
| Address | ciąg | Wyodrębniony adres (tylko prawo jazdy) | "123 ULICA ADRES TWOJE MIASTO WOJ 99999-1234" |
| Region | ciąg | Wyodrębniony region, stan, prowincja itp. (tylko prawo jazdy) | "Washington" |
Przewodnik migracji
- Postępuj zgodnie z naszym przewodnikiem migracji do analizy dokumentów w wersji 3.1, aby dowiedzieć się, jak używać wersji 3.0 w aplikacjach i przepływach pracy.
Dalsze kroki
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.
Spróbuj przetwarzać własne formularze i dokumenty za pomocą narzędzia do etykietowania przykładowego analizy dokumentów.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.