Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ważne
W przypadku wersji zapoznawczych v4.0 analizy dokumentów i późniejszych ogólny model dokumentu (predefiniowany dokument) jest przestarzały. Aby wyodrębnić pary klucz-wartość, znaczniki zaznaczenia, tekst, tabele i strukturę z dokumentów, użyj następujących modeli:
| Funkcja | wersja | Identyfikator modelu |
|---|---|---|
Layout model z włączonym opcjonalnym parametrem features=keyValuePairs ciągu zapytania. |
• v4:2024-11-30 • v3.1:2023-07-31 (GA) |
prebuilt-layout |
| Ogólny model dokumentu | • v3.1:2023-07-31 (GA)• v3.0:2022-08-31 (GA) • wersja 2.1 (GA) |
prebuilt-document |
Ta zawartość dotyczy:
Znacznikwersja 3.1 (GA) | Najnowsza wersja:purple-checkmark wersja 4.0 (GA)Poprzednia wersja:niebieski znacznik wyboruv3.0
Ta zawartość dotyczy:
ZnacznikNajnowsze wersje: purple-checkmark wersja 4.0 (GA)purpurowy znacznik wyboru3.1
Model dokumentu Ogólne łączy zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z modelami uczenia głębokiego w celu wyodrębniania par klucz-wartość, tabel i znaków wyboru z dokumentów. Dokument ogólny jest dostępny z interfejsami API w wersji 3.1 i 3.0. Aby uzyskać więcej informacji, zobacz nasz przewodnik migracji.
Ogólne funkcje dokumentu
Ogólny model dokumentu to wstępnie wytrenowany model; nie wymaga etykiet ani trenowania.
Pojedynczy interfejs API wyodrębnia pary klucz-wartość, znaczniki wyboru, tekst, tabele i strukturę z dokumentów.
Ogólny model dokumentów obsługuje dokumenty ustrukturyzowane, częściowo ustrukturyzowane i nieustrukturyzowane.
Znaczniki wyboru są identyfikowane jako pola o wartości
:selected:lub:unselected:.
Przykładowy dokument przetworzony w programie Document Intelligence Studio
Wyodrębnianie par klucz-wartość
Interfejs API ogólnego dokumentu obsługuje większość typów formularzy i analizuje dokumenty oraz wyodrębnia klucze i skojarzone wartości. Idealnie nadaje się do wyodrębniania typowych par klucz-wartość z dokumentów. Model dokumentu ogólnego można użyć jako alternatywy do trenowania modelu niestandardowego bez etykiet.
Opcje programowania
Narzędzie Document Intelligence w wersji 3.1 obsługuje następujące narzędzia, aplikacje i biblioteki:
| Funkcja | Zasoby | Identyfikator modelu |
|---|---|---|
| Ogólny model dokumentu | • Document Intelligence Studio REST API C# SDK • • |
wstępnie utworzony dokument |
Narzędzie Document Intelligence w wersji 3.0 obsługuje następujące narzędzia, aplikacje i biblioteki:
| Funkcja | Zasoby | Identyfikator modelu |
|---|---|---|
| Ogólny model dokumentu | • Document Intelligence Studio REST API C# SDK • • |
wstępnie utworzony dokument |
Wymagania dotyczące danych wejściowych
Obsługiwane są następujące formaty plików.
| Model | Obraz: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Przeczytaj | ✔ | ✔ | ✔ |
| Układ | ✔ | ✔ | ✔ |
| Dokument ogólny | ✔ | ✔ | |
| Wstępnie utworzona | ✔ | ✔ | |
| Niestandardowe wyodrębnianie | ✔ | ✔ | |
| Klasyfikacja niestandardowa | ✔ | ✔ | ✔ |
- Zdjęcia i skanowania: Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
- Pliki PDF i pliki TIFF: w przypadku plików PDF i plików TIFF można przetworzyć maksymalnie 2000 stron. (W przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko dwie pierwsze strony).
- Rozmiar pliku: rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB dla warstwy bezpłatnej (F0).
- Wymiary obrazu: Wymiary muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
- Blokady haseł: jeśli pliki PDF są zablokowane hasłem, należy usunąć blokadę przed przesłaniem.
- Wysokość tekstu: minimalna wysokość tekstu do wyodrębnienia wynosi 12 pikseli dla obrazu 1024 x 768 pikseli. Ten rozmiar odpowiada około 8-punktowemu tekstowi przy 150 pikselach na cal.
- Trenowanie modelu niestandardowego: maksymalna liczba stron dla danych szkoleniowych to 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
- Trenowanie niestandardowego modelu wyodrębniania: całkowity rozmiar danych treningowych wynosi 50 MB dla modelu wzorcowego i 1 GB dla modelu neuronowego.
- Szkolenie niestandardowego modelu klasyfikacji: całkowity rozmiar danych treningowych wynosi 1 GB, maksymalnie do 10 000 stron. W przypadku wersji 2024-11-30 (GA) całkowity rozmiar danych treningowych wynosi 2 GB z maksymalnie 10 000 stron.
- Typy plików pakietu Office (DOCX, XLSX, PPTX): Maksymalny limit długości ciągu wynosi 8 milionów znaków.
Ogólne wyodrębnianie danych modelu dokumentów
Spróbuj wyodrębnić dane z formularzy i dokumentów przy użyciu programu Document Intelligence Studio.
Potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Uwaga
Program Document Intelligence Studio i ogólny model dokumentów są dostępne za pomocą interfejsu API w wersji 3.0.
Na stronie głównej narzędzia Document Intelligence Studio wybierz pozycję Dokumenty ogólne.
Możesz przeanalizować przykładowy dokument lub przekazać własne pliki.
Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:
Pary klucz-wartość
Pary klucz-wartość są określonymi zakresami w dokumencie, które identyfikują etykietę lub klucz i powiązaną z nią odpowiedź lub wartość. W formularzu ustrukturyzowanym te pary mogą być etykietą i wartością wprowadzoną przez użytkownika dla tego pola. W dokumencie bez struktury mogą one być datą wykonania umowy na podstawie tekstu w akapicie. Model sztucznej inteligencji jest trenowany w celu wyodrębniania możliwych do zidentyfikowania kluczy i wartości w oparciu o szeroką gamę typów dokumentów, formatów i struktur.
Klucze mogą również istnieć w izolacji, gdy model wykryje, że klucz istnieje, bez skojarzonej wartości lub podczas przetwarzania pól opcjonalnych. Na przykład pole nazwy środkowej może być puste w formularzu w niektórych przypadkach. Pary klucz-wartość to zakresy tekstu zawartego w dokumencie. W przypadku dokumentów, w których ta sama wartość jest opisana na różne sposoby, na przykład klient/użytkownik, skojarzony klucz jest klientem lub użytkownikiem (na podstawie kontekstu).
Wyodrębnianie danych
| Model | Wyodrębnianie tekstu | Pary klucz-wartość | Znaczniki zaznaczenia | Tabele | Nazwy pospolite |
|---|---|---|---|---|---|
| Dokument ogólny | ✓ | ✓ | ✓ | ✓ | ✓* |
•* — dostępne tylko w wersjach interfejsu 2023-07-31 API w wersji 3.1 lub nowszej.
Obsługiwane języki i ustawienia regionalne
Zobacz naszą stronę Obsługa języka — modele analizy dokumentów, aby uzyskać pełną listę obsługiwanych języków.
Kwestie wymagające rozważenia
Ponieważ klucze są fragmentami tekstu wyodrębnianego z dokumentu, w przypadku dokumentów częściowo ustrukturyzowanych klucze muszą być mapowane na istniejący słownik kluczy.
Oczekiwano par klucz-wartość z kluczem, ale bez wartości. Jeśli na przykład użytkownik zdecydował się nie podać adresu e-mail w formularzu.
Następne kroki
Postępuj zgodnie z naszym przewodnikiem migracji do analizy dokumentów w wersji 3.1, aby dowiedzieć się, jak używać wersji 3.1 w aplikacjach i przepływach pracy.
Zapoznaj się z naszym interfejsem API REST.