Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ta zawartość dotyczy:checkmarkwersja 4.0 (GA)Poprzednie wersje:niebieski znacznik wyboru v3.1 (GA) v3.0 (GA)niebieski znacznik wyboru v2.1 (GA)niebieski znacznik wyboru
Ta zawartość dotyczy:checkmarkwersja 3.1 (GA)Najnowsza wersja: wersja 4.0 (GA)Poprzednie wersje:purpurowy znacznik wyboruniebieski znacznik wyboruv3.0niebieski znacznik wyboruv2.1
Ta zawartość dotyczy:
Znacznikwersja 3.0 (GA) | Najnowsze wersje:purpurowy znacznik wyboru
purple-checkmark v4.0 (GA) v3.1Poprzednia wersja:niebieski znacznik wyboruwersja 2.1
Ta zawartość dotyczy:
Najnowsza wersja: |
wersja 4.0 (OGÓLNA)
Usługa Azure Document Intelligence w modelach narzędzi Foundry udostępnia obsługę wielojęzycznego przetwarzania dokumentów. Nasze możliwości obsługi języka umożliwiają użytkownikom komunikowanie się z aplikacjami w naturalny sposób i zwiększanie poziomu globalnego wsparcia. Modele analizy dokumentów umożliwiają wyodrębnianie tekstu z formularzy i dokumentów oraz zwracanie zawartości gotowej do działania, użycia lub postępu organizacji. W poniższych tabelach wymieniono dostępny język i ustawienia regionalne obsługiwane przez model i funkcję:
- Przeczytaj: Model odczytu umożliwia wyodrębnianie i analizowanie tekstu drukowanego i odręcznego. Ten model jest podstawowym aparatem OCR dla innych wstępnie utworzonych modeli analizy dokumentów, takich jak układ, dokument ogólny, faktura, paragon, dokument tożsamości ,karta ubezpieczenia zdrowotnego, dokumenty podatkowe i modele niestandardowe. Aby uzyskać więcej informacji, zobaczOmówienie modelu odczytu
- Układ: model układu umożliwia wyodrębnianie i analizowanie tekstu, tabel, struktury dokumentu i znaków zaznaczenia (takich jak przyciski radiowe i pola wyboru) z formularzy i dokumentów.
- Dokument ogólny: Ogólny model dokumentu umożliwia wyodrębnianie i analizowanie par tekstu, struktury dokumentów i par klucz-wartość. Aby uzyskać więcej informacji, zobaczOgólne omówienie modelu dokumentów
Uwaga
Kod języka opcjonalny
Modele uniwersalne oparte na uczeniu głębokim w usłudze Document Intelligence wyodrębniają cały tekst wielojęzyczny w dokumentach, w tym wiersze tekstu z językami mieszanymi i nie wymagają określenia kodu językowego.
Nie podaj kodu języka jako parametru, chyba że masz pewność, że język i chcesz wymusić zastosowanie tylko odpowiedniego modelu. W przeciwnym razie usługa może zwrócić niekompletny i niepoprawny tekst.
Ponadto nie trzeba określać ustawień regionalnych. Jest to opcjonalny parametr. Technologia uczenia głębokiego analizy dokumentów automatycznie wykrywa język tekstu na obrazie.
Odczyt modelu
Identyfikator modelu: wstępnie utworzony odczyt
W poniższej tabeli wymieniono obsługę języka odczytu modelu na potrzeby wyodrębniania i analizowania tekstu drukowanego.
| Język | Kod (opcjonalnie) |
|---|---|
| Abaza | abq |
| Abchaski | ab |
| Achinese | ace |
| Acoli | ach |
| Adangme | ada |
| Adyghe | ady |
| Afar | aa |
| Afrikaans | af |
| Akan | ak |
| Albański | sq |
| Algonquin | alq |
| Angika (Devanagari) | anp |
| Arabski | ar |
| Asturyjski | ast |
| Asu (Tanzania) | asa |
| Avaric | av |
| Awadhi-Hindi (Devanagari) | awa |
| Ajmara | ay |
| Azerbejdżan (łaciński) | az |
| Bafia | ksf |
| Bagheli | bfy |
| Bambara | bm |
| Baszkirski | ba |
| Baskijski | eu |
| Białorusin (cyrylica) |
be, be-cyrl |
| Białorusi (łaciński) |
be, be-latn |
| Bemba (Zambia) | bem |
| Bena (Tanzania) | bez |
| Bhojpuri-Hindi (Devanagari) | bho |
| Bikol | bik |
| Bini | bin |
| Bislama | bi |
| Bodo (Devanagari) | brx |
| Bośniacki (łaciński) | bs |
| Brajbha | bra |
| Bretoński | br |
| Bułgarski | bg |
| Bundeli | bns |
| Buryat (Cyrylica) | bua |
| Kataloński | ca |
| Cebuano | ceb |
| Chamling | rab |
| Chamorro | ch |
| Czeczeński | ce |
| Chhattisgarhi (Devanagari) | hne |
| Chiga | cgg |
| Chiński uproszczony | zh-Hans |
| Chiński tradycyjny | zh-Hant |
| Choctaw | cho |
| Czukotka | ckt |
| Czuwaski | cv |
| Kornwalijski | kw |
| Korsykański | co |
| Cree | cr |
| Potok | mus |
| Tatar krymski (łaciński) | crh |
| Chorwacki | hr |
| Wrona | cro |
| Czeski | cs |
| Duński | da |
| Dargwa | dar |
| Dari | prs |
| Dhimal (Devanagari) | dhi |
| Dogri (Devanagari) | doi |
| Duala | dua |
| Dungan | dng |
| Niderlandzki | nl |
| Efik | efi |
| angielski | en |
| Erzya (cyrylica) | myv |
| Estoński | et |
| Farerski | fo |
| Fidżijski | fj |
| Filipino | fil |
| Fiński | fi |
| Język | Kod (opcjonalnie) |
|---|---|
Fon |
fon |
| Francuski | fr |
| Friulian | fur |
Ga |
gaa |
| Gagauz (łaciński) | gag |
| Galicyjski | gl |
| Ganda | lg |
| Gayo | gay |
| Niemiecki | de |
| Gilbertese | gil |
| Gondi (Devanagari) | gon |
| Grecki | el |
| Grenlandzki | kl |
| Guarani | gn |
| Gurung (Devanagari) | gvr |
| Gusii | guz |
| Kreolski haitański | ht |
| Halbi (Devanagari) | hlb |
| Hani | hni |
| Haryanvi | bgc |
| Hawajski | haw |
| Hebrajski | he |
| Herero | hz |
| Hiligaynon | hil |
| Hindi | hi |
| Hmong Daw (łaciński) | mww |
| Ho(Devanagiri) | hoc |
| Węgierski | hu |
| Iban | iba |
| Islandzki | is |
| Igbo | ig |
| Iloko | ilo |
| Inari Sami | smn |
| Indonezyjski | id |
| Ingush | inh |
| Interlingua | ia |
| Inuktitut (łaciński) | iu |
| Irlandzki | ga |
| Włoski | it |
| japoński | ja |
| Jaunsari (Devanagari) | Jns |
| Jawajski | jv |
| Jola-Fonyi | dyo |
| Kabardian | kbd |
| Kabuverdianu | kea |
| Kachin (łaciński) | kac |
| Kalenjin | kln |
| Kalmyk | xal |
| Kangri (Devanagari) | xnr |
| Kanuri | kr |
| Karachay-Balkar | krc |
| Kara-Kalpak (cyrylica) | kaa-cyrl |
| Kara-Kalpak (łaciński) | kaa |
| Kaszubski | csb |
| Kazachski (cyrylica) | kk-cyrl |
| Kazachski (łaciński) | kk-latn |
| Khakas | kjh |
| Khaling | klr |
| Khasi | kha |
| K'iche' | quc |
| Kikuyu | ki |
| Kildin Sami | sjd |
| Kinyarwanda | rw |
| Komi | kv |
| Kongo | kg |
| Koreański | ko |
| Korku | kfq |
| Koryak | kpy |
| Kosraean | kos |
| Kpelle | kpe |
| Kuanyama | kj |
| Kumyk (Cyrylica) | kum |
| Kurdyjski (arabski) | ku-arab |
| Kurdyjski (łaciński) | ku-latn |
| Kurukh (Devanagari) | kru |
| Kyrgyz (Cyrylica) | ky |
Lak |
lbe |
| Lakota | lkt |
| Język | Kod (opcjonalnie) |
|---|---|
| Łacina | la |
| Łotewski | lv |
| Lezghian | lex |
| Lingala | ln |
| Litewski | lt |
| Dolnołużycki | dsb |
| Lozi | loz |
| Lule Sami | smj |
| Luo (Kenia i Tanzania) | luo |
| Luksemburski | lb |
| Luyia | luy |
| Macedoński | mk |
| Machame | jmc |
| Madurese | mad |
| Mahasu Pahari (Devanagari) | bfz |
| Makhuwa-Meetto | mgh |
| Makonde | kde |
| Malgaski | mg |
| Malajski (łaciński) | ms |
| Maltański | mt |
| Malto (Devanagari) | kmj |
| Mandinka | mnk |
| Manx | gv |
| Maoryski | mi |
| Mapudungun | arn |
| Marathi | mr |
| Mari (Rosja) | chm |
| Masai | mas |
| Mende (Sierra Leone) | men |
| Meru | mer |
| Meta" | mgo |
| Minangkabau | min |
| Mohawk | moh |
| Mongolski (cyrylica) | mn |
| Mongondow | mog |
| Czarnogóra (cyrylica) | cnr-cyrl |
| Czarnogóra (łacińska) | cnr-latn |
| Morisyen | mfe |
| Mundang | mua |
| Język nahuatl | nah |
| Nawaho | nv |
| Ndonga | ng |
| Neapolitański | nap |
| Nepalski | ne |
| Ngomba | jgo |
| Niuean | niu |
| Nogay | nog |
| North Ndebele | nd |
| Północny Sami (łaciński) | sme |
| Norweski | no |
| Nyanja | ny |
| Nyankole | nyn |
| Nzima | nzi |
| Occitan | oc |
| Ojibwa | oj |
| Oromo | om |
| Ossetic | os |
| Pampanga | pam |
| Pangasinan | pag |
| Papiamento | pap |
| Paszto | ps |
| Pedi | nso |
| Perski | fa |
| Polski | pl |
| Portugalski | pt |
| Punjabi (arabski) | pa |
| Keczua | qu |
| Ripuarian | ksh |
| Rumuński | ro |
| Retoromański | rm |
| Rundi | rn |
| Rosyjski | ru |
Rwa |
rwk |
| Sadri (Devanagari) | sck |
| Republika Sacha | sah |
| Samburu | saq |
| Samoan (łaciński) | sm |
| Sango | sg |
| Język | Kod (opcjonalnie) |
|---|---|
| Sangu (Gabon) | snq |
| Sanskrit (Devanagari) | sa |
| Santali (Devanagiri) | sat |
| Szkoci | sco |
| Język szkocki gaelicki | gd |
| Sena | seh |
| Serbski (cyrylica) | sr-cyrl |
| Serbski (łaciński) |
sr, sr-latn |
| Shambala | ksb |
| Shona | sn |
| Siksika | bla |
| Sirmauri (Devanagari) | srx |
| Skolt Sami | sms |
| Słowacki | sk |
| Słoweński | sl |
| Soga | xog |
| Somalia (arabski) | so |
| Somalijski (łaciński) | so-latn |
| Songhai | son |
| South Ndebele | nr |
| Południowy Ałtaj | alt |
| Południowy Sami | sma |
| Południowy Sotho | st |
| Hiszpański | es |
| Sundanese | su |
| Swahili (łaciński) | sw |
| Swati | ss |
| Szwedzki | sv |
| Tabassaran | tab |
| Tachelhit | shi |
| Tahitański | ty |
| Taita | dav |
| Tadżyk (cyrylica) | tg |
| Tamilski | ta |
| Tatar (Cyrylica) | tt-cyrl |
| Tatar (łaciński) | tt |
| Teso | teo |
| Tetum | tet |
| Tajlandzki | th |
| Thangmi | thf |
| Tok Pisin | tpi |
| Tonga | to |
| Tsonga | ts |
| Tswana | tn |
| Turecki | tr |
| Turkmen (łaciński) | tk |
| Tuvan | tyv |
| Udmurt | udm |
| Ujgur (cyrylica) | ug-cyrl |
| Ukraiński | uk |
| Górnołużycki | hsb |
| Urdu | ur |
| Uygur (arabski) | ug |
| Uzbek (arabski) | uz-arab |
| Uzbecki (Cyrylica) | uz-cyrl |
| Uzbek (łaciński) | uz |
| Wietnamski | vi |
| Volapük | vo |
| Vunjo | vun |
| Walser | wae |
| Walijski | cy |
| Zachodni Fryzyjscy | fy |
| Wolof | wo |
| Xhosa | xh |
| Maya | yua |
| Zapotec | zap |
| Zarma | dje |
| Zhen | za |
| Zulu | zu |
W poniższej tabeli wymieniono obsługę języka odczytu modelu na potrzeby wyodrębniania i analizowania tekstu drukowanego.
| Język | Kod (opcjonalnie) |
|---|---|
| Afrikaans | af |
| Angika | anp |
| Arabski | ar |
| Asturyjski | ast |
| Awadhi | awa |
| Azerbejdżański | az |
| Białorusin (cyrylica) |
be, be-cyrl |
| Białorusi (łaciński) | be-latn |
| Bagheli | bfy |
| Mahasu Pahari | bfz |
| Bułgarski | bg |
| Haryanvi | bgc |
| Bhojpuri | bho |
| Bislama | bi |
| Bundeli | bns |
| Bretoński | br |
| Braj | bra |
| Bodo | brx |
| Bośniacki | bs |
| Pochówek | bua |
| Kataloński | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Czarnogóra (łacińska) |
cnr, cnr-latn |
| Czarnogóra (cyrylica) | cnr-cyrl |
| Korsykański | co |
| Krymskotatarski | crh |
| Czeski | cs |
| Kaszubski | csb |
| Walijski | cy |
| Duński | da |
| Niemiecki | de |
| Dhimal | dhi |
| Dogri | doi |
| Dolnołużycki | dsb |
| angielski | en |
| Hiszpański | es |
| Estoński | et |
| Baskijski | eu |
| Perski | fa |
| Fiński | fi |
| Filipino | fil |
| Język | Kod (opcjonalnie) |
|---|---|
| Fidżijski | fj |
| Farerski | fo |
| Francuski | fr |
| Friulian | fur |
| Zachodni Fryzyjscy | fy |
| Irlandzki | ga |
| Gagauz | gag |
| Język szkocki gaelicki | gd |
| Gilbertese | gil |
| Galicyjski | gl |
| Gondi | gon |
| Manx | gv |
| Gurung | gvr |
| Hawajski | haw |
| Hindi | hi |
| Halbi | hlb |
| Chhattisgarhi | hne |
| Hani | hni |
Ho |
hoc |
| Chorwacki | hr |
| Górnołużycki | hsb |
| Haitański | ht |
| Węgierski | hu |
| Interlingua | ia |
| Indonezyjski | id |
| Islandzki | is |
| Włoski | it |
| Inuktitut | iu |
| japoński | |
| Jaunsari | jns |
| Jawajski | jv |
| Kara-Kalpak (łaciński) |
kaa, kaa-latn |
| Kara-Kalpak (cyrylica) | kaa-cyrl |
| Kaczin | kac |
| Kabuverdianu | kea |
| Korku | kfq |
| Khasi | kha |
| Kazachski (łaciński) |
kk, kk-latn |
| Kazachski (cyrylica) | kk-cyrl |
| Grenlandzki | kl |
| Khaling | klr |
| Malto | kmj |
| Język | Kod (opcjonalnie) |
|---|---|
| Koreański | |
| Kosraean | kos |
| Koryak | kpy |
| Karachay-Balkar | krc |
| Kurukh | kru |
| Kölsch | ksh |
| Kurdyjski (łaciński) |
ku, ku-latn |
| Kurdyjski (arabski) | ku-arab |
| Kumyk | kum |
| Kornwalijski | kw |
| Kirgiski | ky |
| Łacina | la |
| Luksemburski | lb |
| Lakota | lkt |
| Litewski | lt |
| Maoryski | mi |
| Mongolski | mn |
| Marathi | mr |
| Malajski | ms |
| Maltański | mt |
Hmong Daw |
mww |
| Erzya | myv |
| Neapolitański | nap |
| Nepalski | ne |
| Niuean | niu |
| Niderlandzki | nl |
| Norweski | no |
| Nogai | nog |
| Occitan | oc |
| Ossetian | os |
| Panjabi | pa |
| Polski | pl |
| Dari | prs |
| Pushto | ps |
| Portugalski | pt |
| K'iche' | quc |
| Camling | rab |
| Retoromański | rm |
| Rumuński | ro |
| Rosyjski | ru |
| Sanskryt | sa |
| Santali | sat |
| Język | Kod (opcjonalnie) |
|---|---|
| Sadri | sck |
| Szkoci | sco |
| Słowacki | sk |
| Słoweński | sl |
| Samoański | sm |
| Południowy Sami | sma |
| Północny Sami | sme |
| Lule Sami | smj |
| Inari Sami | smn |
| Skolt Sami | sms |
| Somalijski | so |
| Albański | sq |
| Serbski (łaciński) |
sr, sr-latn |
| Sirmauri | srx |
| Szwedzki | sv |
| Suahili | sw |
| Tetum | tet |
| Tadżycki | tg |
| Thangmi | thf |
| Turkmeński | tk |
| Tonga | to |
| Turecki | tr |
| Tatarski | tt |
| Tuvinian | tyv |
| Ujgurski | ug |
| Urdu | ur |
| Uzbek (łaciński) |
uz, uz-latn |
| Uzbecki (Cyrylica) | uz-cyrl |
| Uzbek (arabski) | uz-arab |
| Volapük | vo |
| Walser | wae |
| Kangri | xnr |
| Yucateco | yua |
| Zhen | za |
| Chiński (Han (wariant uproszczony)) |
zh, zh-hans |
| Chiński (Han (tradycyjny wariant)) | zh-hant |
| Zulu | zu |
Układ
Identyfikator modelu: wstępnie utworzony układ
W poniższej tabeli wymieniono obsługiwane języki dla tekstu drukowanego:
| Język | Kod (opcjonalnie) |
|---|---|
| Abaza | abq |
| Abchaski | ab |
| Achinese | ace |
| Acoli | ach |
| Adangme | ada |
| Adyghe | ady |
| Afar | aa |
| Afrikaans | af |
| Akan | ak |
| Albański | sq |
| Algonquin | alq |
| Angika (Devanagari) | anp |
| Arabski | ar |
| Asturyjski | ast |
| Asu (Tanzania) | asa |
| Avaric | av |
| Awadhi-Hindi (Devanagari) | awa |
| Ajmara | ay |
| Azerbejdżan (łaciński) | az |
| Bafia | ksf |
| Bagheli | bfy |
| Bambara | bm |
| Baszkirski | ba |
| Baskijski | eu |
| Białorusin (cyrylica) |
be, be-cyrl |
| Białorusi (łaciński) |
be, be-latn |
| Bemba (Zambia) | bem |
| Bena (Tanzania) | bez |
| Bhojpuri-Hindi (Devanagari) | bho |
| Bikol | bik |
| Bini | bin |
| Bislama | bi |
| Bodo (Devanagari) | brx |
| Bośniacki (łaciński) | bs |
| Brajbha | bra |
| Bretoński | br |
| Bułgarski | bg |
| Bundeli | bns |
| Buryat (Cyrylica) | bua |
| Kataloński | ca |
| Cebuano | ceb |
| Chamling | rab |
| Chamorro | ch |
| Czeczeński | ce |
| Chhattisgarhi (Devanagari) | hne |
| Chiga | cgg |
| Chiński uproszczony | zh-Hans |
| Chiński tradycyjny | zh-Hant |
| Choctaw | cho |
| Czukotka | ckt |
| Czuwaski | cv |
| Kornwalijski | kw |
| Korsykański | co |
| Cree | cr |
| Potok | mus |
| Tatar krymski (łaciński) | crh |
| Chorwacki | hr |
| Wrona | cro |
| Czeski | cs |
| Duński | da |
| Dargwa | dar |
| Dari | prs |
| Dhimal (Devanagari) | dhi |
| Dogri (Devanagari) | doi |
| Duala | dua |
| Dungan | dng |
| Niderlandzki | nl |
| Efik | efi |
| angielski | en |
| Erzya (cyrylica) | myv |
| Estoński | et |
| Farerski | fo |
| Fidżijski | fj |
| Filipino | fil |
| Fiński | fi |
| Język | Kod (opcjonalnie) |
|---|---|
Fon |
fon |
| Francuski | fr |
| Friulian | fur |
Ga |
gaa |
| Gagauz (łaciński) | gag |
| Galicyjski | gl |
| Ganda | lg |
| Gayo | gay |
| Niemiecki | de |
| Gilbertese | gil |
| Gondi (Devanagari) | gon |
| Grecki | el |
| Grenlandzki | kl |
| Guarani | gn |
| Gurung (Devanagari) | gvr |
| Gusii | guz |
| Kreolski haitański | ht |
| Halbi (Devanagari) | hlb |
| Hani | hni |
| Haryanvi | bgc |
| Hawajski | haw |
| Hebrajski | he |
| Herero | hz |
| Hiligaynon | hil |
| Hindi | hi |
| Hmong Daw (łaciński) | mww |
| Ho(Devanagiri) | hoc |
| Węgierski | hu |
| Iban | iba |
| Islandzki | is |
| Igbo | ig |
| Iloko | ilo |
| Inari Sami | smn |
| Indonezyjski | id |
| Ingush | inh |
| Interlingua | ia |
| Inuktitut (łaciński) | iu |
| Irlandzki | ga |
| Włoski | it |
| japoński | ja |
| Jaunsari (Devanagari) | Jns |
| Jawajski | jv |
| Jola-Fonyi | dyo |
| Kabardian | kbd |
| Kabuverdianu | kea |
| Kachin (łaciński) | kac |
| Kalenjin | kln |
| Kalmyk | xal |
| Kangri (Devanagari) | xnr |
| Kanuri | kr |
| Karachay-Balkar | krc |
| Kara-Kalpak (cyrylica) | kaa-cyrl |
| Kara-Kalpak (łaciński) | kaa |
| Kaszubski | csb |
| Kazachski (cyrylica) | kk-cyrl |
| Kazachski (łaciński) | kk-latn |
| Khakas | kjh |
| Khaling | klr |
| Khasi | kha |
| K'iche' | quc |
| Kikuyu | ki |
| Kildin Sami | sjd |
| Kinyarwanda | rw |
| Komi | kv |
| Kongo | kg |
| Koreański | ko |
| Korku | kfq |
| Koryak | kpy |
| Kosraean | kos |
| Kpelle | kpe |
| Kuanyama | kj |
| Kumyk (Cyrylica) | kum |
| Kurdyjski (arabski) | ku-arab |
| Kurdyjski (łaciński) | ku-latn |
| Język | Kod (opcjonalnie) |
|---|---|
| Kurukh (Devanagari) | kru |
| Kyrgyz (Cyrylica) | ky |
Lak |
lbe |
| Lakota | lkt |
| Łacina | la |
| Łotewski | lv |
| Lezghian | lex |
| Lingala | ln |
| Litewski | lt |
| Dolnołużycki | dsb |
| Lozi | loz |
| Lule Sami | smj |
| Luo (Kenia i Tanzania) | luo |
| Luksemburski | lb |
| Luyia | luy |
| Macedoński | mk |
| Machame | jmc |
| Madurese | mad |
| Mahasu Pahari (Devanagari) | bfz |
| Makhuwa-Meetto | mgh |
| Makonde | kde |
| Malgaski | mg |
| Malajski (łaciński) | ms |
| Maltański | mt |
| Malto (Devanagari) | kmj |
| Mandinka | mnk |
| Manx | gv |
| Maoryski | mi |
| Mapudungun | arn |
| Marathi | mr |
| Mari (Rosja) | chm |
| Masai | mas |
| Mende (Sierra Leone) | men |
| Meru | mer |
| Meta" | mgo |
| Minangkabau | min |
| Mohawk | moh |
| Mongolski (cyrylica) | mn |
| Mongondow | mog |
| Czarnogóra (cyrylica) | cnr-cyrl |
| Czarnogóra (łacińska) | cnr-latn |
| Morisyen | mfe |
| Mundang | mua |
| Język nahuatl | nah |
| Nawaho | nv |
| Ndonga | ng |
| Neapolitański | nap |
| Nepalski | ne |
| Ngomba | jgo |
| Niuean | niu |
| Nogay | nog |
| North Ndebele | nd |
| Północny Sami (łaciński) | sme |
| Norweski | no |
| Nyanja | ny |
| Nyankole | nyn |
| Nzima | nzi |
| Occitan | oc |
| Ojibwa | oj |
| Oromo | om |
| Ossetic | os |
| Pampanga | pam |
| Pangasinan | pag |
| Papiamento | pap |
| Paszto | ps |
| Pedi | nso |
| Perski | fa |
| Polski | pl |
| Portugalski | pt |
| Punjabi (arabski) | pa |
| Keczua | qu |
| Ripuarian | ksh |
| Rumuński | ro |
| Retoromański | rm |
| Rundi | rn |
| Rosyjski | ru |
| Język | Kod (opcjonalnie) |
|---|---|
Rwa |
rwk |
| Sadri (Devanagari) | sck |
| Republika Sacha | sah |
| Samburu | saq |
| Samoan (łaciński) | sm |
| Sango | sg |
| Sangu (Gabon) | snq |
| Sanskrit (Devanagari) | sa |
| Santali (Devanagiri) | sat |
| Szkoci | sco |
| Język szkocki gaelicki | gd |
| Sena | seh |
| Serbski (cyrylica) | sr-cyrl |
| Serbski (łaciński) |
sr, sr-latn |
| Shambala | ksb |
| Shona | sn |
| Siksika | bla |
| Sirmauri (Devanagari) | srx |
| Skolt Sami | sms |
| Słowacki | sk |
| Słoweński | sl |
| Soga | xog |
| Somalia (arabski) | so |
| Somalijski (łaciński) | so-latn |
| Songhai | son |
| South Ndebele | nr |
| Południowy Ałtaj | alt |
| Południowy Sami | sma |
| Południowy Sotho | st |
| Hiszpański | es |
| Sundanese | su |
| Swahili (łaciński) | sw |
| Swati | ss |
| Szwedzki | sv |
| Tabassaran | tab |
| Tachelhit | shi |
| Tahitański | ty |
| Taita | dav |
| Tadżyk (cyrylica) | tg |
| Tamilski | ta |
| Tatar (Cyrylica) | tt-cyrl |
| Tatar (łaciński) | tt |
| Teso | teo |
| Tetum | tet |
| Tajlandzki | th |
| Thangmi | thf |
| Tok Pisin | tpi |
| Tonga | to |
| Tsonga | ts |
| Tswana | tn |
| Turecki | tr |
| Turkmen (łaciński) | tk |
| Tuvan | tyv |
| Udmurt | udm |
| Ujgur (cyrylica) | ug-cyrl |
| Ukraiński | uk |
| Górnołużycki | hsb |
| Urdu | ur |
| Uygur (arabski) | ug |
| Uzbek (arabski) | uz-arab |
| Uzbecki (Cyrylica) | uz-cyrl |
| Uzbek (łaciński) | uz |
| Wietnamski | vi |
| Volapük | vo |
| Vunjo | vun |
| Walser | wae |
| Walijski | cy |
| Zachodni Fryzyjscy | fy |
| Wolof | wo |
| Xhosa | xh |
| Maya | yua |
| Zapotec | zap |
| Zarma | dje |
| Zhen | za |
| Zulu | zu |
W poniższej tabeli wymieniono obsługę języka modelu układu na potrzeby wyodrębniania i analizowania tekstu drukowanego.
| Język | Kod (opcjonalnie) |
|---|---|
| Afrikaans | af |
| Angika | anp |
| Arabski | ar |
| Asturyjski | ast |
| Awadhi | awa |
| Azerbejdżański | az |
| Białorusin (cyrylica) |
be, be-cyrl |
| Białorusi (łaciński) | be-latn |
| Bagheli | bfy |
| Mahasu Pahari | bfz |
| Bułgarski | bg |
| Haryanvi | bgc |
| Bhojpuri | bho |
| Bislama | bi |
| Bundeli | bns |
| Bretoński | br |
| Braj | bra |
| Bodo | brx |
| Bośniacki | bs |
| Pochówek | bua |
| Kataloński | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Czarnogóra (łacińska) |
cnr, cnr-latn |
| Czarnogóra (cyrylica) | cnr-cyrl |
| Korsykański | co |
| Krymskotatarski | crh |
| Czeski | cs |
| Kaszubski | csb |
| Walijski | cy |
| Duński | da |
| Niemiecki | de |
| Dhimal | dhi |
| Dogri | doi |
| Dolnołużycki | dsb |
| angielski | en |
| Hiszpański | es |
| Estoński | et |
| Baskijski | eu |
| Perski | fa |
| Fiński | fi |
| Filipino | fil |
| Język | Kod (opcjonalnie) |
|---|---|
| Fidżijski | fj |
| Farerski | fo |
| Francuski | fr |
| Friulian | fur |
| Zachodni Fryzyjscy | fy |
| Irlandzki | ga |
| Gagauz | gag |
| Język szkocki gaelicki | gd |
| Gilbertese | gil |
| Galicyjski | gl |
| Gondi | gon |
| Manx | gv |
| Gurung | gvr |
| Hawajski | haw |
| Hindi | hi |
| Halbi | hlb |
| Chhattisgarhi | hne |
| Hani | hni |
Ho |
hoc |
| Chorwacki | hr |
| Górnołużycki | hsb |
| Haitański | ht |
| Węgierski | hu |
| Interlingua | ia |
| Indonezyjski | id |
| Islandzki | is |
| Włoski | it |
| Inuktitut | iu |
| japoński | |
| Jaunsari | jns |
| Jawajski | jv |
| Kara-Kalpak (łaciński) |
kaa, kaa-latn |
| Kara-Kalpak (cyrylica) | kaa-cyrl |
| Kaczin | kac |
| Kabuverdianu | kea |
| Korku | kfq |
| Khasi | kha |
| Kazachski (łaciński) |
kk, kk-latn |
| Kazachski (cyrylica) | kk-cyrl |
| Grenlandzki | kl |
| Khaling | klr |
| Malto | kmj |
| Język | Kod (opcjonalnie) |
|---|---|
| Koreański | |
| Kosraean | kos |
| Koryak | kpy |
| Karachay-Balkar | krc |
| Kurukh | kru |
| Kölsch | ksh |
| Kurdyjski (łaciński) |
ku, ku-latn |
| Kurdyjski (arabski) | ku-arab |
| Kumyk | kum |
| Kornwalijski | kw |
| Kirgiski | ky |
| Łacina | la |
| Luksemburski | lb |
| Lakota | lkt |
| Litewski | lt |
| Maoryski | mi |
| Mongolski | mn |
| Marathi | mr |
| Malajski | ms |
| Maltański | mt |
Hmong Daw |
mww |
| Erzya | myv |
| Neapolitański | nap |
| Nepalski | ne |
| Niuean | niu |
| Niderlandzki | nl |
| Norweski | no |
| Nogai | nog |
| Occitan | oc |
| Ossetian | os |
| Panjabi | pa |
| Polski | pl |
| Dari | prs |
| Pushto | ps |
| Portugalski | pt |
| K'iche' | quc |
| Camling | rab |
| Retoromański | rm |
| Rumuński | ro |
| Rosyjski | ru |
| Sanskryt | sa |
| Santali | sat |
| Język | Kod (opcjonalnie) |
|---|---|
| Sadri | sck |
| Szkoci | sco |
| Słowacki | sk |
| Słoweński | sl |
| Samoański | sm |
| Południowy Sami | sma |
| Północny Sami | sme |
| Lule Sami | smj |
| Inari Sami | smn |
| Skolt Sami | sms |
| Somalijski | so |
| Albański | sq |
| Serbski (łaciński) |
sr, sr-latn |
| Sirmauri | srx |
| Szwedzki | sv |
| Suahili | sw |
| Tetum | tet |
| Tadżycki | tg |
| Thangmi | thf |
| Turkmeński | tk |
| Tonga | to |
| Turecki | tr |
| Tatarski | tt |
| Tuvinian | tyv |
| Ujgurski | ug |
| Urdu | ur |
| Uzbek (łaciński) |
uz, uz-latn |
| Uzbecki (Cyrylica) | uz-cyrl |
| Uzbek (arabski) | uz-arab |
| Volapük | vo |
| Walser | wae |
| Kangri | xnr |
| Yucateco | yua |
| Zhen | za |
| Chiński (Han (wariant uproszczony)) |
zh, zh-hans |
| Chiński (Han (tradycyjny wariant)) | zh-hant |
| Zulu | zu |
| Język | Kod języka |
|---|---|
| Afrikaans | af |
| Albański | sq |
| Asturyjski | ast |
| Baskijski | eu |
| Bislama | bi |
| Bretoński | br |
| Kataloński | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Chiński (uproszczony) | zh-Hans |
| Chiński (tradycyjny) | zh-Hant |
| Kornwalijski | kw |
| Korsykański | co |
| Tatar krymski (łaciński) | crh |
| Czeski | cs |
| Duński | da |
| Niderlandzki | nl |
| Angielski (drukowany i odręczny) | en |
| Estoński | et |
| Fidżijski | fj |
| Filipino | fil |
| Fiński | fi |
| Francuski | fr |
| Friulian | fur |
| Galicyjski | gl |
| Niemiecki | de |
| Gilbertese | gil |
| Grenlandzki | kl |
| Kreolski haitański | ht |
| Hani | hni |
| Hmong Daw (łaciński) | mww |
| Węgierski | hu |
| Indonezyjski | id |
| Interlingua | ia |
| Inuktitut (łaciński) | iu |
| Irlandzki | ga |
| Język | Kod języka |
|---|---|
| Włoski | it |
| japoński | ja |
| Jawajski | jv |
| K'iche' | quc |
| Kabuverdianu | kea |
| Kachin (łaciński) | kac |
| Kara-Kalpak | kaa |
| Kaszubski | csb |
| Khasi | kha |
| Koreański | ko |
| Kurdyjski (łaciński) | kur |
| Luksemburski | lb |
| Malajski (łaciński) | ms |
| Manx | gv |
| Neapolitański | nap |
| Norweski | no |
| Occitan | oc |
| Polski | pl |
| Portugalski | pt |
| Retoromański | rm |
| Szkoci | sco |
| Język szkocki gaelicki | gd |
| Słoweński | slv |
| Hiszpański | es |
| Swahili (łaciński) | sw |
| Szwedzki | sv |
| Tatar (łaciński) | tat |
| Tetum | tet |
| Turecki | tr |
| Górnołużycki | hsb |
| Uzbek (łaciński) | uz |
| Volapük | vo |
| Walser | wae |
| Zachodni Fryzyjscy | fy |
| Maya | yua |
| Zhen | za |
| Zulu | zu |
Dokument ogólny
Ważne
W przypadku analizy dokumentów w wersji 4.0:2024-11-30 (GA) ogólny model dokumentu (wstępnie utworzony dokument) jest dodawany do układu (wstępnie utworzony układ). Aby wyodrębnić pary klucz-wartość, znaczniki zaznaczenia, tekst, tabele i strukturę z dokumentów, użyj następujących modeli:
| Pary klucz-wartość | wersja | Identyfikator modelu |
|---|---|---|
Model układu z określonym ciągiem features=keyValuePairs zapytania. |
• v4:2024-11-30 (GA) • v3.1:2023-07-31 (GA) |
prebuilt-layout |
| Ogólny model dokumentu | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
Identyfikator modelu: wstępnie utworzony dokument
W poniższej tabeli wymieniono ogólną obsługę języka modelu dokumentów.
Model ID |
Język — kod ustawień regionalnych | Wartość domyślna |
|---|---|---|
| wstępnie utworzony dokument | Angielski (Stany Zjednoczone)— en-US |
Angielski (Stany Zjednoczone)— en-US |