Udostępnij przez


Wymagania i ograniczenia dotyczące modelu przetwarzania dokumentów

Obsługiwane języki

Model dla dokumentów o stałym szablonie

Następujące języki są obsługiwane podczas trenowania modelu przetwarzania dokumentów i wybierania dokumentów o stałym szablonie jako typu dokumentu:

Abaza, abchaski, achiński, acoli, adangme, adygejski, afarski, afrikaans, akan, albański, algonkiński, angika (dewanagari), arabski, asturyjski, asu (Tanzania), awarski, awadhi-hindi (dewanagari), ajmara, azerski (łac.), bafijski, bagheli, bambara, baszkirski, baskijski, białoruski (cyrylica), białoruski (łacina), bemba (Zambia), bhojpuri-hindi (dewanagari), bikol, bini, bislama, bodo (dewanagari), bośniacki (łacina), brajbha, bretoński, bułgarski, bundeli, buriacki (cyrylica), kataloński, cebuano, chamling, chamorro, czeczeński, chhattisgarhi (dewanagari), chiga, chiński uproszczony, chiński tradycyjny, choktaw, czukot, czuwaski, kornwalijski, korsykański, cree, creek, tatarski krymski (łacina), chorwacki, wroni, czeski, duński, dargwa, dari, dhimal (dewanagari), dogri (dewanagari), duala, dungański, niderlandzki, efik, angielski, erija (cyrylica), estoński, farerski, fidżyjski, filipiński, fiński, fon, francuski, friulski, ga, gagauski (łac.), galicyjski, ganda, gayo, niemiecki, gilbertyński, gondi (dewanagari), grecki, grenlandzki, guarani, gurung (dewanagari), gusii, kreolski haitański, halbi (dewanagari), hani, haryanvi, hawajski, hebrajski, herero, hiligajnon, hindi, hmong daw (łac.), ho (dewanagiri), węgierski, iban, islandzki, igbo, iloko, inari lapoński, indonezyjski, inguski, interlingua, inuktitut (łac.), irlandzki, włoski, japoński, jaunsari (dewanagari), jawajski, jola-fonyi, kabardyjski, kabuverdianu, kachiński (łac.), kalendżin, kałmucki, kangri (dewanagari), kanuri, karaczaj-bałkar, kara-kalpak (cyrylica), kara-kalpak (łac.), kaszubski, kazachski (cyrylica), kazachski (łac.), khakas, khaling, khasi, k'iche', kikuyu, kildin sami, kinyarwanda, komi, kongo, koreański, korku, koryak, kosraean, kpelle, kuanyama, kumyk (cyrylica), kurdyjski (arabski), kurdyjski (łacina), kurukh (dewanagari), kirgiski (cyrylica), lak, lakota, łacina, łotewski, lezgiński, lingala, litewski, dolnołużycki, lozi, lule sami, luo (Kenia i Tanzania), luksemburski, luyia luy, macedoński, machame, madurese, mahasu pahari (dewanagari), makhuwa-meetto, makonde, malgaski, malajski (łac.), maltański, malto (dewanagari), mandinka, manx, maoryski, mapudungun, marathi, mari (rosyjski), masajski, mende (Sierra Leone), meru, meta', minangkabau, mohawk, mongolski (cyrylica), mongondow, czarnogórski (cyrylica), czarnogórski (łacina), morisyen, mundang, nahuatl, navajo, ndonga, neapolitański, nepalski, ngomba, niuean, nogay, północny ndebele, północny lapoński (łacina), norweski, nyanja, nyankole, nzima, oksytański, ojibwa, oromo, osetyjski, pampanga, pangasinan, papiamento, paszto, pedi, perski, polski, portugalski, pendżabski (arabski), keczua, ripuaryjski, rumuński, romansz, rundi, rosyjski, rwa, sadri (dewanagari), sacha, samburu, samoański (łac.), sango, sangu (gaboński), sanskryt (dewanagari), santali (dewanagiri), szkocki, szkocki gaelicki, sena, serbski (cyrylica), serbski (łac.), szambala, szerpa (dewanagari), szona, siksika, sirmauri (dewanagari), skolt lapoński, słowacki, słoweński, soga, somalijski (arabski), somalijski (łacina), songhai, południowy ndebele, południowy ałtajski, południowy lapoński, południowy sotho, hiszpański, sundański, suahili (łacina), swati, szwedzki, tabassaran, tachelhit, tahitański, taita, tadżycki (cyrylica), tamilski, tatarski (cyrylica), tatarski (łacina), teso, tetum, tajski, thangmi, tok pisin, tongański, tsonga, tswana, turecki, turkmeński (łacina), tuwiński, udmurcki, ujgurski (cyrylica), ukraiński, górnołużycki, urdu, ujgurski (arabski), uzbecki (arabski), uzbecki (cyrylica), uzbecki (łacina), wietnamski, volapük, vunjo, walserski, walijski, zachodniofryzyjski, wolof, xhosa, jukatecki maja, zapotecki, zarma, zhuang, zulu

Model dla dokumentów ogólnych

Następujące języki są obsługiwane podczas trenowania modelu przetwarzania dokumentów i wybierania pozycji Ogólne dokumenty jako typ dokumentu.

Afrikaans, albański, arabski, bułgarski, chiński (Han (uproszczony wariant)), chiński (Han (tradycyjny wariant)), chorwacki, czeski, duński, holenderski, estoński, fiński, francuski, niemiecki, hebrajski, hindi, węgierski, indonezyjski, włoski, japoński, koreański, łotewski, litewski, macedoński, marathi, nowoczesny grecki (1453-), nepalski (makrojęzyczny), norweski, Panjabi, perski, polski, portugalski, rumuński, rosyjski, słowacki, słoweński, somalijski (arabski), somalijski (łaciński), hiszpański, suahili (makrojęzyczny), szwedzki, tamilski, tajski, turecki, ukraiński, urdu, wietnamski

Requirements

Przetwarzanie dokumentów działa na dokumentach wejściowych spełniających następujące wymagania:

  • FORMAT JPG, PNG lub PDF (tekst lub skanowanie). Pliki PDF osadzone w tekście są lepsze, ponieważ nie będzie żadnych błędów podczas wyodrębniania i lokalizacji znaków.
  • Plików TIFF nie można używać do trenowania. Aby wytrenować model, musisz użyć dokumentów w formacie PDF, JPG lub PNG. Po wytrenowaniu modelu można wyodrębnić dane z plików TIFF, gdy model jest używany w przepływie chmury usługi Power Automate.
  • Jeśli pliki PDF są zablokowane hasłem, przed przesłaniem należy usunąć blokadę.
  • Maksymalny rozmiar dokumentu do przetworzenia nie może przekraczać 20 MB.
  • W przypadku obrazów wymiary muszą mieć od 50 × 50 do 10 000 × 10 000 pikseli.
  • W przypadku skanowania z dokumentów papierowych skany powinny być wysokiej jakości.
  • Można utworzyć maksymalnie 200 kolekcji na model.
  • W przepływie chmury limit pól, które można oznaczyć do przetwarzania dokumentów, wynosi 300.

Uwaga / Notatka

  • Wyodrębnianie podpisów z dokumentów jest obecnie obsługiwane tylko w przypadku dokumentów o stałych szablonach.
  • Pola, które dzielą granice stron, nie są obecnie obsługiwane.
  • Łamanie wierzy między stronami, nie jest obecnie obsługiwane.

Porada dotycząca optymalizacji

Dowiedz się, jak poprawić wydajność modeli przetwarzania dokumentów.

Następny krok

Tworzenie modelu przetwarzania formularzy