Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Este conteúdo aplica-se a:
marca de verificaçãov3.1 (GA) | Última versão:purple-checkmark v4.0 (GA)Versões anteriores: Marca de verificação azulv3.0Marca de verificação azulv2.1
Este conteúdo aplica-se a: | marca de verificação roxapurple-checkmark v4.0 (GA) Versão anterior:Marca de verificação azulv2.1
Este conteúdo aplica-se a:
|
v4.0 (GA)
O Azure Document Intelligence nos modelos Foundry Tools fornece suporte para processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem o alcance global. Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para os negócios pronto para a ação, uso ou progresso da sua organização. As tabelas a seguir listam o suporte de idioma e localidade disponível por modelo e recurso:
- Leia: O modelo de leitura permite a extração e análise de texto impresso e manuscrito. Este modelo é o mecanismo de OCR subjacente para outros modelos pré-construídos de Inteligência Documental, como layout, documento geral, fatura, recibo, documento de identidade (ID), cartão de seguro de saúde, documentos fiscais e modelos personalizados. Para obter mais informações, consulteLer visão geral do modelo
- Layout: O modelo de layout permite extrair e analisar texto, tabelas, estrutura do documento e marcas de seleção (como botões de opção e caixas de seleção) de formulários e documentos.
- Documento geral: O modelo de documento geral permite a extração e análise de texto, estrutura do documento e pares chave-valor. Para obter mais informações, consulteVisão geral do modelo de documento
Nota
Código linguístico opcional
Os modelos universais baseados em aprendizagem profunda do Document Intelligence extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma.
Não forneça o código do idioma como parâmetro, a menos que tenha certeza do idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço pode retornar texto incompleto e incorreto.
Além disso, não é necessário especificar uma localidade. Este é um parâmetro opcional. A tecnologia de aprendizagem profunda Document Intelligence irá detetar automaticamente a linguagem de texto na sua imagem.
Ler modelo
ID do modelo: leitura pré-embutida
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .
| Linguagem | Código (opcional) |
|---|---|
| Abaza | abq |
| Abcásia | ab |
| Chinês | ace |
| Acoli | ach |
| Adangme | ada |
| Adyghe | ady |
| Afar | aa |
| Afrikaans | af |
| Akan | ak |
| Albanês | sq |
| Algonquin | alq |
| Angika (Devanagari) | anp |
| Árabe | ar |
| Asturiano | ast |
| Asu (Tanzânia) | asa |
| Avaric | av |
| Awadhi-Hindi (Devanagari) | awa |
| Aymara | ay |
| Azerbaijão (Latim) | az |
| Máfia | ksf |
| Bagheli | bfy |
| Bambara | bm |
| Basquir | ba |
| Basco | eu |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (Latim) |
be, be-latn |
| Bemba (Zâmbia) | bem |
| Bena (Tanzânia) | bez |
| Bhojpuri-Hindi (Devanagari) | bho |
| Bikol | bik |
| Bini | bin |
| Bislama | bi |
| Bodo (Devanagari) | brx |
| Bósnio (Latim) | bs |
| Brajbha | bra |
| Bretão | br |
| Búlgaro | bg |
| Bundeli | bns |
| Buryat (cirílico) | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamling | rab |
| Chamorro | ch |
| Checheno | ce |
| Chhattisgarhi (Devanagari) | hne |
| Chiga | cgg |
| Chineses (Simplificado) | zh-Hans |
| Chinês (Tradicional) | zh-Hant |
| Choctaw | cho |
| Chukot | ckt |
| Chuvash | cv |
| Cornualha | kw |
| Córsega | co |
| Cree | cr |
| Riacho | mus |
| Tártaro da Crimeia (latim) | crh |
| Croata | hr |
| Corvo | cro |
| Checo | cs |
| Dinamarquês | da |
| Dargwa | dar |
| Dari | prs |
| Dhimal (Devanagari) | dhi |
| Dogri (Devanagari) | doi |
| Duala | dua |
| Dungan | dng |
| Neerlandês | nl |
| Efik | efi |
| Inglês | en |
| Erzya (cirílico) | myv |
| Estónio | et |
| Faroense | fo |
| Fijiano | fj |
| Filipino | fil |
| Finlandês | fi |
| Linguagem | Código (opcional) |
|---|---|
Fon |
fon |
| Francês | fr |
| Friuliano | fur |
Ga |
gaa |
| Gagauz (latim) | gag |
| Galego | gl |
| Ganda | lg |
| Gayo | gay |
| Alemão | de |
| Gilbertese | gil |
| Gondi (Devanagari) | gon |
| Grego | el |
| Gronelândia | kl |
| Guarani | gn |
| Gurung (Devanágari) | gvr |
| Gusii | guz |
| Crioulo haitiano | ht |
| Halbi (Devanagari) | hlb |
| Hani | hni |
| Haryanvi | bgc |
| Havaiano | haw |
| Hebraico | he |
| Herero | hz |
| Hiligaynon | hil |
| Hindi | hi |
| Hmong Daw (Latim) | mww |
| Ho(Devanagiri) | hoc |
| Húngaro | hu |
| Iban | iba |
| Islandês | is |
| Igbo | ig |
| Iloko | ilo |
| Inari Sami | smn |
| Indonésio | id |
| Inguche | inh |
| Interlíngua | ia |
| Inuktitut (latim) | iu |
| Irlandês | ga |
| Italiano | it |
| Japonês | ja |
| Jaunsari (Devanagari) | Jns |
| Javanês | jv |
| Jola-Fonyi | dyo |
| Kabardiano | kbd |
| Kabuverdianu | kea |
| Kachin (Latim) | kac |
| Kalenjin | kln |
| Kalmyk | xal |
| Kangri (Devanagari) | xnr |
| Kanuri | kr |
| Karachay-Balkar | krc |
| Kara-Kalpak (cirílico) | kaa-cyrl |
| Kara-Kalpak (Latim) | kaa |
| Kashubian | csb |
| Cazaque (cirílico) | kk-cyrl |
| Cazaque (Latim) | kk-latn |
| Khakas | kjh |
| Khaling | klr |
| Khasi | kha |
| K'iche» | quc |
| Kikuyu | ki |
| Kildin Sami | sjd |
| Kinyarwanda | rw |
| Komi | kv |
| Kongo | kg |
| Coreano | ko |
| Korku | kfq |
| Koryak | kpy |
| Kosraean | kos |
| Kpelle | kpe |
| Kuanyama | kj |
| Kumyk (cirílico) | kum |
| Curdo (árabe) | ku-arab |
| Curdo (latim) | ku-latn |
| Kurukh (Devanagari) | kru |
| Quirguistão (cirílico) | ky |
Lak |
lbe |
| Lakota | lkt |
| Linguagem | Código (opcional) |
|---|---|
| Latim | la |
| Letão | lv |
| Lezghian | lex |
| Lingala | ln |
| Lituano | lt |
| Baixo Sorbian | dsb |
| Lozi | loz |
| Lule Sami | smj |
| Luo (Quênia e Tanzânia) | luo |
| Luxemburguês | lb |
| Luyia | luy |
| Macedónio | mk |
| Machame | jmc |
| Madurese | mad |
| Mahasu Pahari (Devanagari) | bfz |
| Makhuwa-Meetto | mgh |
| Makonde | kde |
| Malgaxe | mg |
| Malaio (Latim) | ms |
| Maltês | mt |
| Malto (Devanagari) | kmj |
| Mandinka | mnk |
| Manx | gv |
| Maori | mi |
| Mapudungun | arn |
| Marata | mr |
| Mari (Rússia) | chm |
| Masai | mas |
| Mende (Serra Leoa) | men |
| Meru | mer |
| Meta» | mgo |
| Minangkabau | min |
| Mohawk | moh |
| Mongol (cirílico) | mn |
| Mongondow | mog |
| Montenegrino (cirílico) | cnr-cyrl |
| Montenegrino (Latim) | cnr-latn |
| Morisyen | mfe |
| Mundang | mua |
| Nahuatl | nah |
| Navajo | nv |
| Ndonga | ng |
| Napolitano | nap |
| Nepalês | ne |
| Ngomba | jgo |
| Niuean | niu |
| Nogay | nog |
| Ndebele do Norte | nd |
| Sami do Norte (Latim) | sme |
| Norueguês | no |
| Nyanja | ny |
| Nyankole | nyn |
| Nzima | nzi |
| Occitano | oc |
| Ojibwa | oj |
| Oromo | om |
| Ossético | os |
| Pampanga | pam |
| Pangasinan | pag |
| Papiamento | pap |
| Pashto | ps |
| Pedi | nso |
| Persa | fa |
| Polaco | pl |
| Português | pt |
| Punjabi (árabe) | pa |
| Quechua | qu |
| Ripuariano | ksh |
| Romeno | ro |
| Romanche | rm |
| Rundi | rn |
| Russo | ru |
Rwa |
rwk |
| Sadri (Devanagari) | sck |
| Sakha | sah |
| Samburu | saq |
| Samoa (Latim) | sm |
| Sango | sg |
| Linguagem | Código (opcional) |
|---|---|
| Sangu (Gabão) | snq |
| Sânscrito (Devanagari) | sa |
| Santali(Devanagiri) | sat |
| Escoceses | sco |
| Gaélico escocês | gd |
| Sena | seh |
| Sérvio (Cirílico) | sr-cyrl |
| Sérvio (Latim) |
sr, sr-latn |
| Shambala | ksb |
| Shona | sn |
| Siksika | bla |
| Sirmauri (Devanagari) | srx |
| Skolt Sami | sms |
| Eslovaco | sk |
| Esloveno | sl |
| Soga | xog |
| Somali (árabe) | so |
| Somali (Latim) | so-latn |
| Songhai | son |
| Ndebele do Sul | nr |
| Altai do Sul | alt |
| Sami Meridional | sma |
| Sotho do Sul | st |
| Espanhol | es |
| Sundanês | su |
| Swahili (latim) | sw |
| Suazilândia | ss |
| Sueco | sv |
| Tabassaran | tab |
| Tachelhit | shi |
| Taitiano | ty |
| Taita | dav |
| Tajique (cirílico) | tg |
| Tâmil | ta |
| Tártaro (cirílico) | tt-cyrl |
| Tártaro (Latim) | tt |
| Teso | teo |
| Tétum | tet |
| Tailandês | th |
| Thangmi | thf |
| Tok Pisin | tpi |
| Tonga | to |
| Tsonga | ts |
| Tswana | tn |
| Turco | tr |
| Turquemeno (latim) | tk |
| Tuvan | tyv |
| Udmurt | udm |
| Uigur (cirílico) | ug-cyrl |
| Ucraniano | uk |
| Alto Sorábio | hsb |
| Urdu | ur |
| Uigur (árabe) | ug |
| Uzbeque (árabe) | uz-arab |
| Usbeque (Cirílico) | uz-cyrl |
| Uzbeque (Latim) | uz |
| Vietnamita | vi |
| Volapük | vo |
| Vunjo | vun |
| Walser | wae |
| Galês | cy |
| Frísio Ocidental | fy |
| Wolof | wo |
| Xhosa | xh |
| Iucatego | yua |
| Zapoteca | zap |
| Zarma | dje |
| Zhuang | za |
| Zulu | zu |
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .
| Linguagem | Código (opcional) |
|---|---|
| Afrikaans | af |
| Angika | anp |
| Árabe | ar |
| Asturiano | ast |
| Awadhi | awa |
| Azerbaijanês | az |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (Latim) | be-latn |
| Bagheli | bfy |
| Mahasu Pahari | bfz |
| Búlgaro | bg |
| Haryanvi | bgc |
| Bhojpuri | bho |
| Bislama | bi |
| Bundeli | bns |
| Bretão | br |
| Braj | bra |
| Bodo | brx |
| Bósnio | bs |
| Buriat | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Montenegrino (Latim) |
cnr, cnr-latn |
| Montenegrino (cirílico) | cnr-cyrl |
| Córsega | co |
| Tártaro da Crimeia | crh |
| Checo | cs |
| Kashubian | csb |
| Galês | cy |
| Dinamarquês | da |
| Alemão | de |
| Dhimal | dhi |
| Dogri | doi |
| Baixo Sorbian | dsb |
| Inglês | en |
| Espanhol | es |
| Estónio | et |
| Basco | eu |
| Persa | fa |
| Finlandês | fi |
| Filipino | fil |
| Linguagem | Código (opcional) |
|---|---|
| Fijiano | fj |
| Faroense | fo |
| Francês | fr |
| Friuliano | fur |
| Frísio Ocidental | fy |
| Irlandês | ga |
| Gagauz | gag |
| Gaélico escocês | gd |
| Gilbertese | gil |
| Galego | gl |
| Gondi | gon |
| Manx | gv |
| Gurung | gvr |
| Havaiano | haw |
| Hindi | hi |
| Halbi | hlb |
| Chhattisgarhi | hne |
| Hani | hni |
Ho |
hoc |
| Croata | hr |
| Alto Sorábio | hsb |
| Haitiano | ht |
| Húngaro | hu |
| Interlíngua | ia |
| Indonésio | id |
| Islandês | is |
| Italiano | it |
| Inuktitut | iu |
| Japonês | |
| Jaunsari | jns |
| Javanês | jv |
| Kara-Kalpak (Latim) |
kaa, kaa-latn |
| Kara-Kalpak (cirílico) | kaa-cyrl |
| Kachin | kac |
| Kabuverdianu | kea |
| Korku | kfq |
| Khasi | kha |
| Cazaque (Latim) |
kk, kk-latn |
| Cazaque (cirílico) | kk-cyrl |
| Kalaallisut | kl |
| Khaling | klr |
| Malto | kmj |
| Linguagem | Código (opcional) |
|---|---|
| Coreano | |
| Kosraean | kos |
| Koryak | kpy |
| Karachay-Balkar | krc |
| Kurukh | kru |
| Kölsch | ksh |
| Curdo (latim) |
ku, ku-latn |
| Curdo (árabe) | ku-arab |
| Kumyk | kum |
| Cornualha | kw |
| Quirguiz | ky |
| Latim | la |
| Luxemburguês | lb |
| Lakota | lkt |
| Lituano | lt |
| Maori | mi |
| Mongol | mn |
| Marata | mr |
| Malaio | ms |
| Maltês | mt |
Hmong Daw |
mww |
| Erzya | myv |
| Napolitano | nap |
| Nepalês | ne |
| Niuean | niu |
| Neerlandês | nl |
| Norueguês | no |
| Nogai | nog |
| Occitano | oc |
| Ossétia | os |
| Panjabi | pa |
| Polaco | pl |
| Dari | prs |
| Pushto | ps |
| Português | pt |
| K'iche» | quc |
| Camling | rab |
| Romanche | rm |
| Romeno | ro |
| Russo | ru |
| Sânscrito | sa |
| Santali | sat |
| Linguagem | Código (opcional) |
|---|---|
| Sadri | sck |
| Escoceses | sco |
| Eslovaco | sk |
| Esloveno | sl |
| Samoano | sm |
| Sami Meridional | sma |
| Sami do Norte | sme |
| Lule Sami | smj |
| Inari Sami | smn |
| Skolt Sami | sms |
| Somali | so |
| Albanês | sq |
| Sérvio (Latim) |
sr, sr-latn |
| Sirmauri | srx |
| Sueco | sv |
| Suaíli | sw |
| Tétum | tet |
| Tajique | tg |
| Thangmi | thf |
| Turquemenistão | tk |
| Tonga | to |
| Turco | tr |
| Tatar | tt |
| Tuviniano | tyv |
| Uigur | ug |
| Urdu | ur |
| Uzbeque (Latim) |
uz, uz-latn |
| Usbeque (Cirílico) | uz-cyrl |
| Uzbeque (árabe) | uz-arab |
| Volapük | vo |
| Walser | wae |
| Kangri | xnr |
| Yucateco | yua |
| Zhuang | za |
| Chinês (Han (variante simplificada)) |
zh, zh-hans |
| Chinês (Han (variante tradicional)) | zh-hant |
| Zulu | zu |
Esquema
ID do modelo: layout pré-construído
A tabela a seguir lista os idiomas suportados para texto impresso:
| Idioma | Código (opcional) |
|---|---|
| Abaza | abq |
| Abcásia | ab |
| Chinês | ace |
| Acoli | ach |
| Adangme | ada |
| Adyghe | ady |
| Afar | aa |
| Afrikaans | af |
| Akan | ak |
| Albanês | sq |
| Algonquin | alq |
| Angika (Devanagari) | anp |
| Árabe | ar |
| Asturiano | ast |
| Asu (Tanzânia) | asa |
| Avaric | av |
| Awadhi-Hindi (Devanagari) | awa |
| Aymara | ay |
| Azerbaijão (Latim) | az |
| Máfia | ksf |
| Bagheli | bfy |
| Bambara | bm |
| Basquir | ba |
| Basco | eu |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (Latim) |
be, be-latn |
| Bemba (Zâmbia) | bem |
| Bena (Tanzânia) | bez |
| Bhojpuri-Hindi (Devanagari) | bho |
| Bikol | bik |
| Bini | bin |
| Bislama | bi |
| Bodo (Devanagari) | brx |
| Bósnio (Latim) | bs |
| Brajbha | bra |
| Bretão | br |
| Búlgaro | bg |
| Bundeli | bns |
| Buryat (cirílico) | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamling | rab |
| Chamorro | ch |
| Checheno | ce |
| Chhattisgarhi (Devanagari) | hne |
| Chiga | cgg |
| Chineses (Simplificado) | zh-Hans |
| Chinês (Tradicional) | zh-Hant |
| Choctaw | cho |
| Chukot | ckt |
| Chuvash | cv |
| Cornualha | kw |
| Córsega | co |
| Cree | cr |
| Riacho | mus |
| Tártaro da Crimeia (latim) | crh |
| Croata | hr |
| Corvo | cro |
| Checo | cs |
| Dinamarquês | da |
| Dargwa | dar |
| Dari | prs |
| Dhimal (Devanagari) | dhi |
| Dogri (Devanagari) | doi |
| Duala | dua |
| Dungan | dng |
| Neerlandês | nl |
| Efik | efi |
| Inglês | en |
| Erzya (cirílico) | myv |
| Estónio | et |
| Faroense | fo |
| Fijiano | fj |
| Filipino | fil |
| Finlandês | fi |
| Linguagem | Código (opcional) |
|---|---|
Fon |
fon |
| Francês | fr |
| Friuliano | fur |
Ga |
gaa |
| Gagauz (latim) | gag |
| Galego | gl |
| Ganda | lg |
| Gayo | gay |
| Alemão | de |
| Gilbertese | gil |
| Gondi (Devanagari) | gon |
| Grego | el |
| Gronelândia | kl |
| Guarani | gn |
| Gurung (Devanágari) | gvr |
| Gusii | guz |
| Crioulo haitiano | ht |
| Halbi (Devanagari) | hlb |
| Hani | hni |
| Haryanvi | bgc |
| Havaiano | haw |
| Hebraico | he |
| Herero | hz |
| Hiligaynon | hil |
| Hindi | hi |
| Hmong Daw (Latim) | mww |
| Ho(Devanagiri) | hoc |
| Húngaro | hu |
| Iban | iba |
| Islandês | is |
| Igbo | ig |
| Iloko | ilo |
| Inari Sami | smn |
| Indonésio | id |
| Inguche | inh |
| Interlíngua | ia |
| Inuktitut (latim) | iu |
| Irlandês | ga |
| Italiano | it |
| Japonês | ja |
| Jaunsari (Devanagari) | Jns |
| Javanês | jv |
| Jola-Fonyi | dyo |
| Kabardiano | kbd |
| Kabuverdianu | kea |
| Kachin (Latim) | kac |
| Kalenjin | kln |
| Kalmyk | xal |
| Kangri (Devanagari) | xnr |
| Kanuri | kr |
| Karachay-Balkar | krc |
| Kara-Kalpak (cirílico) | kaa-cyrl |
| Kara-Kalpak (Latim) | kaa |
| Kashubian | csb |
| Cazaque (cirílico) | kk-cyrl |
| Cazaque (Latim) | kk-latn |
| Khakas | kjh |
| Khaling | klr |
| Khasi | kha |
| K'iche» | quc |
| Kikuyu | ki |
| Kildin Sami | sjd |
| Kinyarwanda | rw |
| Komi | kv |
| Kongo | kg |
| Coreano | ko |
| Korku | kfq |
| Koryak | kpy |
| Kosraean | kos |
| Kpelle | kpe |
| Kuanyama | kj |
| Kumyk (cirílico) | kum |
| Curdo (árabe) | ku-arab |
| Curdo (latim) | ku-latn |
| Linguagem | Código (opcional) |
|---|---|
| Kurukh (Devanagari) | kru |
| Quirguistão (cirílico) | ky |
Lak |
lbe |
| Lakota | lkt |
| Latim | la |
| Letão | lv |
| Lezghian | lex |
| Lingala | ln |
| Lituano | lt |
| Baixo Sorbian | dsb |
| Lozi | loz |
| Lule Sami | smj |
| Luo (Quênia e Tanzânia) | luo |
| Luxemburguês | lb |
| Luyia | luy |
| Macedónio | mk |
| Machame | jmc |
| Madurese | mad |
| Mahasu Pahari (Devanagari) | bfz |
| Makhuwa-Meetto | mgh |
| Makonde | kde |
| Malgaxe | mg |
| Malaio (Latim) | ms |
| Maltês | mt |
| Malto (Devanagari) | kmj |
| Mandinka | mnk |
| Manx | gv |
| Maori | mi |
| Mapudungun | arn |
| Marata | mr |
| Mari (Rússia) | chm |
| Masai | mas |
| Mende (Serra Leoa) | men |
| Meru | mer |
| Meta» | mgo |
| Minangkabau | min |
| Mohawk | moh |
| Mongol (cirílico) | mn |
| Mongondow | mog |
| Montenegrino (cirílico) | cnr-cyrl |
| Montenegrino (Latim) | cnr-latn |
| Morisyen | mfe |
| Mundang | mua |
| Nahuatl | nah |
| Navajo | nv |
| Ndonga | ng |
| Napolitano | nap |
| Nepalês | ne |
| Ngomba | jgo |
| Niuean | niu |
| Nogay | nog |
| Ndebele do Norte | nd |
| Sami do Norte (Latim) | sme |
| Norueguês | no |
| Nyanja | ny |
| Nyankole | nyn |
| Nzima | nzi |
| Occitano | oc |
| Ojibwa | oj |
| Oromo | om |
| Ossético | os |
| Pampanga | pam |
| Pangasinan | pag |
| Papiamento | pap |
| Pashto | ps |
| Pedi | nso |
| Persa | fa |
| Polaco | pl |
| Português | pt |
| Punjabi (árabe) | pa |
| Quechua | qu |
| Ripuariano | ksh |
| Romeno | ro |
| Romanche | rm |
| Rundi | rn |
| Russo | ru |
| Linguagem | Código (opcional) |
|---|---|
Rwa |
rwk |
| Sadri (Devanagari) | sck |
| Sakha | sah |
| Samburu | saq |
| Samoa (Latim) | sm |
| Sango | sg |
| Sangu (Gabão) | snq |
| Sânscrito (Devanagari) | sa |
| Santali(Devanagiri) | sat |
| Escoceses | sco |
| Gaélico escocês | gd |
| Sena | seh |
| Sérvio (Cirílico) | sr-cyrl |
| Sérvio (Latim) |
sr, sr-latn |
| Shambala | ksb |
| Shona | sn |
| Siksika | bla |
| Sirmauri (Devanagari) | srx |
| Skolt Sami | sms |
| Eslovaco | sk |
| Esloveno | sl |
| Soga | xog |
| Somali (árabe) | so |
| Somali (Latim) | so-latn |
| Songhai | son |
| Ndebele do Sul | nr |
| Altai do Sul | alt |
| Sami Meridional | sma |
| Sotho do Sul | st |
| Espanhol | es |
| Sundanês | su |
| Swahili (latim) | sw |
| Suazilândia | ss |
| Sueco | sv |
| Tabassaran | tab |
| Tachelhit | shi |
| Taitiano | ty |
| Taita | dav |
| Tajique (cirílico) | tg |
| Tâmil | ta |
| Tártaro (cirílico) | tt-cyrl |
| Tártaro (Latim) | tt |
| Teso | teo |
| Tétum | tet |
| Tailandês | th |
| Thangmi | thf |
| Tok Pisin | tpi |
| Tonga | to |
| Tsonga | ts |
| Tswana | tn |
| Turco | tr |
| Turquemeno (latim) | tk |
| Tuvan | tyv |
| Udmurt | udm |
| Uigur (cirílico) | ug-cyrl |
| Ucraniano | uk |
| Alto Sorábio | hsb |
| Urdu | ur |
| Uigur (árabe) | ug |
| Uzbeque (árabe) | uz-arab |
| Usbeque (Cirílico) | uz-cyrl |
| Uzbeque (Latim) | uz |
| Vietnamita | vi |
| Volapük | vo |
| Vunjo | vun |
| Walser | wae |
| Galês | cy |
| Frísio Ocidental | fy |
| Wolof | wo |
| Xhosa | xh |
| Iucatego | yua |
| Zapoteca | zap |
| Zarma | dje |
| Zhuang | za |
| Zulu | zu |
A tabela a seguir lista o suporte à linguagem do modelo de layout para extrair e analisar texto impresso .
| Idioma | Código (opcional) |
|---|---|
| Afrikaans | af |
| Angika | anp |
| Árabe | ar |
| Asturiano | ast |
| Awadhi | awa |
| Azerbaijanês | az |
| Bielorrusso (cirílico) |
be, be-cyrl |
| Bielorrusso (Latim) | be-latn |
| Bagheli | bfy |
| Mahasu Pahari | bfz |
| Búlgaro | bg |
| Haryanvi | bgc |
| Bhojpuri | bho |
| Bislama | bi |
| Bundeli | bns |
| Bretão | br |
| Braj | bra |
| Bodo | brx |
| Bósnio | bs |
| Buriat | bua |
| Catalão | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Montenegrino (Latim) |
cnr, cnr-latn |
| Montenegrino (cirílico) | cnr-cyrl |
| Córsega | co |
| Tártaro da Crimeia | crh |
| Checo | cs |
| Kashubian | csb |
| Galês | cy |
| Dinamarquês | da |
| Alemão | de |
| Dhimal | dhi |
| Dogri | doi |
| Baixo Sorbian | dsb |
| Inglês | en |
| Espanhol | es |
| Estónio | et |
| Basco | eu |
| Persa | fa |
| Finlandês | fi |
| Filipino | fil |
| Linguagem | Código (opcional) |
|---|---|
| Fijiano | fj |
| Faroense | fo |
| Francês | fr |
| Friuliano | fur |
| Frísio Ocidental | fy |
| Irlandês | ga |
| Gagauz | gag |
| Gaélico escocês | gd |
| Gilbertese | gil |
| Galego | gl |
| Gondi | gon |
| Manx | gv |
| Gurung | gvr |
| Havaiano | haw |
| Hindi | hi |
| Halbi | hlb |
| Chhattisgarhi | hne |
| Hani | hni |
Ho |
hoc |
| Croata | hr |
| Alto Sorábio | hsb |
| Haitiano | ht |
| Húngaro | hu |
| Interlíngua | ia |
| Indonésio | id |
| Islandês | is |
| Italiano | it |
| Inuktitut | iu |
| Japonês | |
| Jaunsari | jns |
| Javanês | jv |
| Kara-Kalpak (Latim) |
kaa, kaa-latn |
| Kara-Kalpak (cirílico) | kaa-cyrl |
| Kachin | kac |
| Kabuverdianu | kea |
| Korku | kfq |
| Khasi | kha |
| Cazaque (Latim) |
kk, kk-latn |
| Cazaque (cirílico) | kk-cyrl |
| Kalaallisut | kl |
| Khaling | klr |
| Malto | kmj |
| Linguagem | Código (opcional) |
|---|---|
| Coreano | |
| Kosraean | kos |
| Koryak | kpy |
| Karachay-Balkar | krc |
| Kurukh | kru |
| Kölsch | ksh |
| Curdo (latim) |
ku, ku-latn |
| Curdo (árabe) | ku-arab |
| Kumyk | kum |
| Cornualha | kw |
| Quirguiz | ky |
| Latim | la |
| Luxemburguês | lb |
| Lakota | lkt |
| Lituano | lt |
| Maori | mi |
| Mongol | mn |
| Marata | mr |
| Malaio | ms |
| Maltês | mt |
Hmong Daw |
mww |
| Erzya | myv |
| Napolitano | nap |
| Nepalês | ne |
| Niuean | niu |
| Neerlandês | nl |
| Norueguês | no |
| Nogai | nog |
| Occitano | oc |
| Ossétia | os |
| Panjabi | pa |
| Polaco | pl |
| Dari | prs |
| Pushto | ps |
| Português | pt |
| K'iche» | quc |
| Camling | rab |
| Romanche | rm |
| Romeno | ro |
| Russo | ru |
| Sânscrito | sa |
| Santali | sat |
| Linguagem | Código (opcional) |
|---|---|
| Sadri | sck |
| Escoceses | sco |
| Eslovaco | sk |
| Esloveno | sl |
| Samoano | sm |
| Sami Meridional | sma |
| Sami do Norte | sme |
| Lule Sami | smj |
| Inari Sami | smn |
| Skolt Sami | sms |
| Somali | so |
| Albanês | sq |
| Sérvio (Latim) |
sr, sr-latn |
| Sirmauri | srx |
| Sueco | sv |
| Suaíli | sw |
| Tétum | tet |
| Tajique | tg |
| Thangmi | thf |
| Turquemenistão | tk |
| Tonga | to |
| Turco | tr |
| Tatar | tt |
| Tuviniano | tyv |
| Uigur | ug |
| Urdu | ur |
| Uzbeque (Latim) |
uz, uz-latn |
| Usbeque (Cirílico) | uz-cyrl |
| Uzbeque (árabe) | uz-arab |
| Volapük | vo |
| Walser | wae |
| Kangri | xnr |
| Yucateco | yua |
| Zhuang | za |
| Chinês (Han (variante simplificada)) |
zh, zh-hans |
| Chinês (Han (variante tradicional)) | zh-hant |
| Zulu | zu |
| Linguagem | Código de idioma |
|---|---|
| Afrikaans | af |
| Albanês | sq |
| Asturiano | ast |
| Basco | eu |
| Bislama | bi |
| Bretão | br |
| Catalão | ca |
| Cebuano | ceb |
| Chamorro | ch |
| Chinês (Simplificado) | zh-Hans |
| Chinês (Tradicional) | zh-Hant |
| Cornualha | kw |
| Córsega | co |
| Tártaro da Crimeia (latim) | crh |
| Checo | cs |
| Dinamarquês | da |
| Neerlandês | nl |
| Inglês (impresso e manuscrito) | en |
| Estónio | et |
| Fijiano | fj |
| Filipino | fil |
| Finlandês | fi |
| Francês | fr |
| Friuliano | fur |
| Galego | gl |
| Alemão | de |
| Gilbertese | gil |
| Gronelândia | kl |
| Crioulo haitiano | ht |
| Hani | hni |
| Hmong Daw (Latim) | mww |
| Húngaro | hu |
| Indonésio | id |
| Interlíngua | ia |
| Inuktitut (latim) | iu |
| Irlandês | ga |
| Linguagem | Código de idioma |
|---|---|
| Italiano | it |
| Japonês | ja |
| Javanês | jv |
| K'iche» | quc |
| Kabuverdianu | kea |
| Kachin (Latim) | kac |
| Kara-Kalpak | kaa |
| Kashubian | csb |
| Khasi | kha |
| Coreano | ko |
| Curdo (latim) | kur |
| Luxemburguês | lb |
| Malaio (Latim) | ms |
| Manx | gv |
| Napolitano | nap |
| Norueguês | no |
| Occitano | oc |
| Polaco | pl |
| Português | pt |
| Romanche | rm |
| Escoceses | sco |
| Gaélico escocês | gd |
| Esloveno | slv |
| Espanhol | es |
| Swahili (latim) | sw |
| Sueco | sv |
| Tártaro (Latim) | tat |
| Tétum | tet |
| Turco | tr |
| Alto Sorábio | hsb |
| Uzbeque (Latim) | uz |
| Volapük | vo |
| Walser | wae |
| Frísio Ocidental | fy |
| Iucatego | yua |
| Zhuang | za |
| Zulu | zu |
Documento geral
Importante
Com o Document Intelligence v4.0:2024-11-30 (GA), o modelo geral de documento (documento pré-construído) está sendo adicionado ao layout (layout pré-construído). Para extrair pares chave-valor, marcas de seleção, texto, tabelas e estrutura de documentos, use os seguintes modelos:
| Pares de valores-chave | versão | ID do modelo |
|---|---|---|
Modelo de layout com seqüência de caracteres de features=keyValuePairs consulta especificada. |
• v4:2024-11-30 (GA) • v3.1:2023-07-31 (GA) |
prebuilt-layout |
| Modelo de documento geral | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
ID do modelo: documento pré-construído
A tabela a seguir lista o suporte geral ao idioma do modelo de documento.
Modelo ID |
Idioma—Código de localidade | Predefinido |
|---|---|---|
| documento pré-construído | Inglês (Estados Unidos)—en-US |
Inglês (Estados Unidos)—en-US |