Esse conteúdo se aplica a:
v2.1 | Última versão:
v4.0 (GA)
Os modelos do Azure Document Intelligence nas Foundry Tools fornecem suporte ao processamento multilíngue de documentos. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem a divulgação global. Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para negócios pronto para a ação, o uso ou o progresso da sua organização. As tabelas a seguir listam o suporte ao idioma e local disponíveis por modelo e recurso:
-
Leitura: o modelo de leitura permite a extração e análise de texto impresso e manuscrito. O modelo é o mecanismo de OCR subjacente para outros modelos predefinidos da Informação de Documentos, como layout, documento geral, fatura, recibo, identidade (ID), cartão de seguro saúde, documentos fiscais e modelos personalizados. Para saber mais, confiraVisão geral do modelo de leitura
-
Layout: o modelo de layout permite a extração e análise de texto, tabelas, estrutura de documentos e marcas de seleção (como botões de opção e caixas de seleção) de formulários e documentos.
Observação
Código de idioma opcional
Os modelos universais baseados em aprendizado profundo da Informação de Documentos extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma.
Não forneça o código de idioma como o parâmetro, a menos que você tenha certeza do idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço poderá retornar texto incompleto e incorreto.
Também não é necessário especificar um local. Esse é um parâmetro opcional. A tecnologia de aprendizagem profunda da Informação de Documentos detectará automaticamente o idioma do texto em sua imagem.
Modelo de leitura
ID do modelo: prebuilt-read
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso.
| Linguagem |
Código (opcional) |
| Abaza |
abq |
| Abecásia |
ab |
| Achinese |
ace |
| Acoli |
ach |
| Adangme |
ada |
| Adyghe |
ady |
| Afar |
aa |
| Africâner |
af |
| Akan |
ak |
| Albanês |
sq |
| Algonquin |
alq |
| Angika (Devanagari) |
anp |
| Árabe |
ar |
| Asturiano |
ast |
| Asu (Tanzânia) |
asa |
| Avaric |
av |
| Awadhi-Hindi (Devanagari) |
awa |
| Aimará |
ay |
| Azerbaijão (Latino) |
az |
| Bafia |
ksf |
| Bagheli |
bfy |
| Bambara |
bm |
| Bashkir |
ba |
| Basco |
eu |
| bielorrusso (cirílico) |
be, be-cyrl |
| bielorrusso (latino) |
be, be-latn |
| Bemba (Zâmbia) |
bem |
| Bena (Tanzânia) |
bez |
| Bhojpuri-Hindi (Devanagari) |
bho |
| Bikol |
bik |
| Bini |
bin |
| Bislama |
bi |
| Bodo (Devanagari) |
brx |
| Bósnio (latim) |
bs |
| Brajbha |
bra |
| Bretão |
br |
| Búlgaro |
bg |
| Bundeli |
bns |
| buryat (cirílico) |
bua |
| Catalão |
ca |
| Cebuano |
ceb |
| Chamling |
rab |
| Chamorro |
ch |
| Checheno |
ce |
| Chhattisgarhi (Devanagari) |
hne |
| Chiga |
cgg |
| Chinês simplificado |
zh-Hans |
| Chinês (tradicional) |
zh-Hant |
| Choctaw |
cho |
| Chukot |
ckt |
| Chuvash |
cv |
| Córnico |
kw |
| Corso |
co |
| Cree |
cr |
| Creek |
mus |
| Tártaro da Crimeia (latim) |
crh |
| Croata |
hr |
| Crow |
cro |
| Tcheco |
cs |
| Dinamarquês |
da |
| Dargwa |
dar |
| Dari |
prs |
| Dhimal (Devanagari) |
dhi |
| Dogri (Devanágari) |
doi |
| Duala |
dua |
| Dungan |
dng |
| Holandês |
nl |
| Efik |
efi |
| Inglês |
en |
| erzya (cirílico) |
myv |
| Estoniano |
et |
| Feroês |
fo |
| Fijiano |
fj |
| Filipino |
fil |
| Finlandês |
fi |
| Linguagem |
Código (opcional) |
Fon |
fon |
| Francês |
fr |
| Friuliano |
fur |
Ga |
gaa |
| gagauz (latino) |
gag |
| Galego |
gl |
| Ganda |
lg |
| Gayo |
gay |
| Alemão |
de |
| Gilbertês |
gil |
| Gondi (Devanagari) |
gon |
| Grego |
el |
| Groenlandês |
kl |
| Guarani |
gn |
| Gurung (Devanagari) |
gvr |
| Gusii |
guz |
| Crioulo haitiano |
ht |
| Halbi (Devanagari) |
hlb |
| Hani |
hni |
| Haryanvi |
bgc |
| havaiano |
haw |
| Hebraico |
he |
| Herero |
hz |
| Hiligaynon |
hil |
| Híndi |
hi |
| Hmong daw (latim) |
mww |
| Ho(Devanagiri) |
hoc |
| Húngaro |
hu |
| Iban |
iba |
| Islandês |
is |
| Igbo |
ig |
| Iloko |
ilo |
| sami de Inari |
smn |
| Indonésio |
id |
| Ingush |
inh |
| Interlíngua |
ia |
| Inuktitut (Latino) |
iu |
| Irlandês |
ga |
| Italiano |
it |
| Japonês |
ja |
| Jaunsari (Devanagari) |
Jns |
| Javanês |
jv |
| Jola-Fonyi |
dyo |
| Kabardian |
kbd |
| Kabuverdianu |
kea |
| Kachin (latim) |
kac |
| Kalenjin |
kln |
| Kalmyk |
xal |
| Kangri (Devanagari) |
xnr |
| Kanuri |
kr |
| Karachay-Balkar |
krc |
| kara-kalpak (cirílico) |
kaa-cyrl |
| kara-kalpak (latino) |
kaa |
| Cashubiano |
csb |
| cazaque (cirílico) |
kk-cyrl |
| cazaque (latino) |
kk-latn |
| Khakas |
kjh |
| Khaling |
klr |
| Khasi |
kha |
| K'iche' |
quc |
| Kikuyu |
ki |
| Kildin Sami |
sjd |
| Quiniaruanda |
rw |
| Komi |
kv |
| Kongo |
kg |
| Coreano |
ko |
| Korku |
kfq |
| koryak |
kpy |
| kosraean |
kos |
| Kpelle |
kpe |
| Kuanyama |
kj |
| kumyk (cirílico) |
kum |
| Curdo (árabe) |
ku-arab |
| Curdo (latino) |
ku-latn |
| Kurukh (Devanagari) |
kru |
| Quirguistão (Cirílico) |
ky |
Lak |
lbe |
| Lakota |
lkt |
| Linguagem |
Código (opcional) |
| Latim |
la |
| Letão |
lv |
| Lezghian |
lex |
| Lingala |
ln |
| Lituano |
lt |
| baixo sorábio |
dsb |
| Lozi |
loz |
| sami de Lule |
smj |
| Luo (Quênia e Tanzânia) |
luo |
| Luxemburguês |
lb |
| Luyia |
luy |
| Macedônio |
mk |
| Machame |
jmc |
| Madurese |
mad |
| Mahasu Pahari (Devanagari) |
bfz |
| Makhuwa-Meetto |
mgh |
| Makonde |
kde |
| Malgaxe |
mg |
| Malaio (latino) |
ms |
| Maltês |
mt |
| Malto (Devanagari) |
kmj |
| Mandinka |
mnk |
| Manx |
gv |
| Maori |
mi |
| Mapudungun |
arn |
| Marati |
mr |
| Mari (Rússia) |
chm |
| Masai |
mas |
| Mende (Serra Leoa) |
men |
| Meru |
mer |
| Meta' |
mgo |
| Minangkabau |
min |
| Mohawk |
moh |
| Mongol (Cirílico) |
mn |
| Mongondow |
mog |
| montenegrino (cirílico) |
cnr-cyrl |
| montenegrino (latino) |
cnr-latn |
| Morisyen |
mfe |
| Mundang |
mua |
| Nahuatl |
nah |
| Navajo |
nv |
| Ndonga |
ng |
| Napolitano |
nap |
| Nepali |
ne |
| Ngomba |
jgo |
| niueano |
niu |
| nogay |
nog |
| Ndebele do Norte |
nd |
| sami setentrional (latino) |
sme |
| Norueguês |
no |
| Nianja |
ny |
| Nyankole |
nyn |
| Nzima |
nzi |
| Occitânico |
oc |
| Ojibwa |
oj |
| Oromo |
om |
| osseto |
os |
| Pampanga |
pam |
| Pangasinan |
pag |
| Papiamento |
pap |
| Pashto |
ps |
| Pedi |
nso |
| Persa |
fa |
| Polonês |
pl |
| Português |
pt |
| Punjabi (Árabe) |
pa |
| Quíchua |
qu |
| ripuário |
ksh |
| Romeno |
ro |
| Romanche |
rm |
| Rundi |
rn |
| Russo |
ru |
Rwa |
rwk |
| Sadri (Devanagari) |
sck |
| Sakha |
sah |
| Samburu |
saq |
| samoano (latino) |
sm |
| Sango |
sg |
| Linguagem |
Código (opcional) |
| Sangu (Gabão) |
snq |
| Sânscrito (Devanagari) |
sa |
| Santali(Devanagiri) |
sat |
| Escocês |
sco |
| Gaélico escocês |
gd |
| Sena |
seh |
| Sérvio (cirílico) |
sr-cyrl |
| Sérvio (latino) |
sr, sr-latn |
| Shambala |
ksb |
| Shona |
sn |
| Siksika |
bla |
| Sirmauri (Devanagari) |
srx |
| sami de Skolt |
sms |
| Eslovaco |
sk |
| Esloveno |
sl |
| Soga |
xog |
| Somali (árabe) |
so |
| Somali (latino) |
so-latn |
| Songhai |
son |
| Ndebele do Sul |
nr |
| Altai do Sul |
alt |
| sami do sul |
sma |
| Sotho do Sul |
st |
| Espanhol |
es |
| Sundanês |
su |
| Suaíli (latim) |
sw |
| Swati |
ss |
| Sueco |
sv |
| Tabassaran |
tab |
| Tachelhit |
shi |
| Taitiano |
ty |
| Taita |
dav |
| Tadjique (Cirílico) |
tg |
| Tâmil |
ta |
| Tatar (cirílico) |
tt-cyrl |
| Tártaro (latim) |
tt |
| Teso |
teo |
| Tetum |
tet |
| Tailandês |
th |
| Thani |
thf |
| Tok Pisin |
tpi |
| Tongan |
to |
| Tsonga |
ts |
| Tswana |
tn |
| Turco |
tr |
| turcomeno (latino) |
tk |
| Tuva |
tyv |
| Udmurt |
udm |
| Uighur (cirílico) |
ug-cyrl |
| Ucraniano |
uk |
| Alto sorábio |
hsb |
| Urdu |
ur |
| Uigur (árabe) |
ug |
| Usbeque (árabe) |
uz-arab |
| Uzbeque (cirílico) |
uz-cyrl |
| Uzbeque (latino) |
uz |
| Vietnamita |
vi |
| Volapuque |
vo |
| Vunjo |
vun |
| Walser |
wae |
| Galês |
cy |
| Frísio ocidental |
fy |
| Wolof |
wo |
| Xhosa |
xh |
| Yucatec Maya |
yua |
| Zapoteca |
zap |
| Zarma |
dje |
| Zuangue |
za |
| Zulu |
zu |
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso.
| Linguagem |
Código (opcional) |
| Africâner |
af |
| Angika |
anp |
| Árabe |
ar |
| Asturiano |
ast |
| Awadhi |
awa |
| Azerbaidjano |
az |
| bielorrusso (cirílico) |
be, be-cyrl |
| bielorrusso (latino) |
be-latn |
| Bagheli |
bfy |
| Mahasu Pahari |
bfz |
| Búlgaro |
bg |
| Haryanvi |
bgc |
| Bhojpuri |
bho |
| Bislama |
bi |
| Bundeli |
bns |
| Bretão |
br |
| Braj |
bra |
| Bodo |
brx |
| Bósnio |
bs |
| Buriat |
bua |
| Catalão |
ca |
| Cebuano |
ceb |
| Chamorro |
ch |
| montenegrino (latino) |
cnr, cnr-latn |
| montenegrino (cirílico) |
cnr-cyrl |
| Corso |
co |
| Tártaro da Crimeia |
crh |
| Tcheco |
cs |
| Cashubiano |
csb |
| Galês |
cy |
| Dinamarquês |
da |
| Alemão |
de |
| Dhimal |
dhi |
| Dogri |
doi |
| baixo sorábio |
dsb |
| Inglês |
en |
| Espanhol |
es |
| Estoniano |
et |
| Basco |
eu |
| Persa |
fa |
| Finlandês |
fi |
| Filipino |
fil |
| Linguagem |
Código (opcional) |
| Fijiano |
fj |
| Feroês |
fo |
| Francês |
fr |
| Friuliano |
fur |
| Frísio ocidental |
fy |
| Irlandês |
ga |
| Gagauz |
gag |
| Gaélico escocês |
gd |
| Gilbertês |
gil |
| Galego |
gl |
| Gondi |
gon |
| Manx |
gv |
| Gurung |
gvr |
| havaiano |
haw |
| Híndi |
hi |
| Halbi |
hlb |
| Chhattisgarhi |
hne |
| Hani |
hni |
Ho |
hoc |
| Croata |
hr |
| Alto sorábio |
hsb |
| Haitiano |
ht |
| Húngaro |
hu |
| Interlíngua |
ia |
| Indonésio |
id |
| Islandês |
is |
| Italiano |
it |
| Inuktitut |
iu |
| Japonês |
|
| Jaunsari |
jns |
| Javanês |
jv |
| kara-kalpak (latino) |
kaa, kaa-latn |
| kara-kalpak (cirílico) |
kaa-cyrl |
| Kachin |
kac |
| Kabuverdianu |
kea |
| Korku |
kfq |
| Khasi |
kha |
| cazaque (latino) |
kk, kk-latn |
| cazaque (cirílico) |
kk-cyrl |
| Groelandês |
kl |
| Khaling |
klr |
| Malto |
kmj |
| Linguagem |
Código (opcional) |
| Coreano |
|
| kosraean |
kos |
| koryak |
kpy |
| Karachay-Balkar |
krc |
| Kurukh |
kru |
| Kölsch |
ksh |
| Curdo (latino) |
ku, ku-latn |
| Curdo (árabe) |
ku-arab |
| Kumyk |
kum |
| Córnico |
kw |
| Quirguiz |
ky |
| Latim |
la |
| Luxemburguês |
lb |
| Lakota |
lkt |
| Lituano |
lt |
| Maori |
mi |
| Mongol |
mn |
| Marati |
mr |
| Malaio |
ms |
| Maltês |
mt |
Hmong Daw |
mww |
| Erzya |
myv |
| Napolitano |
nap |
| Nepali |
ne |
| niueano |
niu |
| Holandês |
nl |
| Norueguês |
no |
| Nogai |
nog |
| Occitânico |
oc |
| Ossetian |
os |
| Panjabi |
pa |
| Polonês |
pl |
| Dari |
prs |
| Pushto |
ps |
| Português |
pt |
| K'iche' |
quc |
| Camling |
rab |
| Romanche |
rm |
| Romeno |
ro |
| Russo |
ru |
| Sânscrito |
sa |
| Santali |
sat |
| Linguagem |
Código (opcional) |
| Sadri |
sck |
| Escocês |
sco |
| Eslovaco |
sk |
| Esloveno |
sl |
| Samoano |
sm |
| sami do sul |
sma |
| Sami do Norte |
sme |
| sami de Lule |
smj |
| sami de Inari |
smn |
| sami de Skolt |
sms |
| Somali |
so |
| Albanês |
sq |
| Sérvio (latino) |
sr, sr-latn |
| Sirmauri |
srx |
| Sueco |
sv |
| Swahili |
sw |
| Tetum |
tet |
| Tajik |
tg |
| Thani |
thf |
| Turcomeno |
tk |
| Tonganês |
to |
| Turco |
tr |
| Tártaro |
tt |
| Tuviniano |
tyv |
| Uighur |
ug |
| Urdu |
ur |
| Uzbeque (latino) |
uz, uz-latn |
| Uzbeque (cirílico) |
uz-cyrl |
| Usbeque (árabe) |
uz-arab |
| Volapuque |
vo |
| Walser |
wae |
| Kangri |
xnr |
| Yucateco |
yua |
| Zuangue |
za |
| Chinês (Han (variante simplificada)) |
zh, zh-hans |
| Chinês (Han (variante tradicional)) |
zh-hant |
| Zulu |
zu |
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto manuscrito.
| Linguagem |
Código de idioma (opcional) |
Linguagem |
Código de idioma (opcional) |
| Inglês |
en |
Japonês |
ja |
| Chinês simplificado |
zh-Hans |
Coreano |
ko |
| Francês |
fr |
Português |
pt |
| Alemão |
de |
Espanhol |
es |
| Italiano |
it |
Russo |
ru |
| Tailandês |
th |
Árabe |
ar |
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto manuscrito.
| Linguagem |
Código de idioma (opcional) |
Linguagem |
Código de idioma (opcional) |
| Inglês |
en |
Japonês |
ja |
| Chinês simplificado |
zh-Hans |
Coreano |
ko |
| Francês |
fr |
Português |
pt |
| Alemão |
de |
Espanhol |
es |
| Italiano |
it |
|
|
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto manuscrito.
| Linguagem |
Código de idioma (opcional) |
Linguagem |
Código de idioma (opcional) |
| Inglês |
en |
Japonês |
ja |
| Chinês simplificado |
zh-Hans |
Coreano |
ko |
| Francês |
fr |
Português |
pt |
| Alemão |
de |
Espanhol |
es |
| Italiano |
it |
|
|
A API do modelo de leitura dá suporte à detecção de idioma para os idiomas a seguir em seus documentos. Esta lista pode incluir idiomas que não têm suporte para extração de texto no momento.
Importante
Detecção de idioma
- O modelo de leitura da Informação de Documentos pode detectar a presença de idiomas e retornar códigos de idioma para os idiomas detectados.
Idiomas detectados versus idiomas extraídos
- Esta seção lista os idiomas que podemos detectar nos documentos usando o modelo de leitura, se aplicável.
- Observe que essa lista é diferente da lista de idiomas dos quais damos suporte à extração de texto, que é especificada nas seções acima para cada modelo.
| Linguagem |
Code |
| Africâner |
af |
| Albanês |
sq |
| Amárico |
am |
| Árabe |
ar |
| Armênia |
hy |
| Assamês |
as |
| Azerbaidjano |
az |
| Basco |
eu |
| Bielorrusso |
be |
| Bengali |
bn |
| Bósnio |
bs |
| Búlgaro |
bg |
| Birmanês |
my |
| Catalão |
ca |
| Khmer Central |
km |
| Chinês |
zh |
| Chinês simplificado |
zh_chs |
| Chinês (tradicional) |
zh_cht |
| Corso |
co |
| Croata |
hr |
| Tcheco |
cs |
| Dinamarquês |
da |
| Dari |
prs |
| Dhivehi |
dv |
| Holandês |
nl |
| Inglês |
en |
| Esperanto |
eo |
| Estoniano |
et |
| Fijiano |
fj |
| Finlandês |
fi |
| Francês |
fr |
| Galego |
gl |
| Georgiano |
ka |
| Alemão |
de |
| Grego |
el |
| Guzerate |
gu |
| Haitiano |
ht |
| Hausa |
ha |
| Hebraico |
he |
| Híndi |
hi |
| Hmong daw |
mww |
| Húngaro |
hu |
| Islandês |
is |
| Igbo |
ig |
| Indonésio |
id |
| Inuktitut |
iu |
| Irlandês |
ga |
| Italiano |
it |
| Japonês |
ja |
| Javanês |
jv |
| canarim |
kn |
| Cazaque |
kk |
| Quiniaruanda |
rw |
| Quirguiz |
ky |
| Coreano |
ko |
| Curdo |
ku |
| Laosiano |
lo |
| Latim |
la |
| Linguagem |
Code |
| Letão |
lv |
| Lituano |
lt |
| Luxemburguês |
lb |
| Macedônio |
mk |
| Malgaxe |
mg |
| Malaio |
ms |
| Malaiala |
ml |
| Maltês |
mt |
| Maori |
mi |
| Marati |
mr |
| Mongol |
mn |
| Nepali |
ne |
| Norueguês |
no |
| Norueguês Nynorsk |
nn |
| Oriá |
or |
| Pasht |
ps |
| Persa |
fa |
| Polonês |
pl |
| Português |
pt |
| Panjabi |
pa |
| Querétaro Otomi |
otq |
| Romeno |
ro |
| Russo |
ru |
| Samoano |
sm |
| Sérvio |
sr |
| Shona |
sn |
| Sindhi |
sd |
| Sinhala |
si |
| Eslovaco |
sk |
| Esloveno |
sl |
| Somali |
so |
| Espanhol |
es |
| Sundanês |
su |
| Swahili |
sw |
| Sueco |
sv |
| Tagalo |
tl |
| Taitiano |
ty |
| Tajik |
tg |
| Tâmil |
ta |
| Tártaro |
tt |
| Télugo |
te |
| Tailandês |
th |
| Tibetano |
bo |
| Tigrinya |
ti |
| Tongan |
to |
| Turco |
tr |
| Turcomeno |
tk |
| Ucraniano |
uk |
| Urdu |
ur |
| Uzbek |
uz |
| Vietnamita |
vi |
| Galês |
cy |
| Xhosa |
xh |
| Iídiche |
yi |
| Ioruba |
yo |
| Yucatec Maya |
yua |
| Zulu |
zu |
Layout
ID do modelo: prebuilt-layout
A tabela a seguir lista os idiomas com suporte para texto impresso:
|
Idioma |
Código (opcional) |
| Abaza |
abq |
| Abecásia |
ab |
| Achinese |
ace |
| Acoli |
ach |
| Adangme |
ada |
| Adyghe |
ady |
| Afar |
aa |
| Africâner |
af |
| Akan |
ak |
| Albanês |
sq |
| Algonquin |
alq |
| Angika (Devanagari) |
anp |
| Árabe |
ar |
| Asturiano |
ast |
| Asu (Tanzânia) |
asa |
| Avaric |
av |
| Awadhi-Hindi (Devanagari) |
awa |
| Aimará |
ay |
| Azerbaijão (Latino) |
az |
| Bafia |
ksf |
| Bagheli |
bfy |
| Bambara |
bm |
| Bashkir |
ba |
| Basco |
eu |
| bielorrusso (cirílico) |
be, be-cyrl |
| bielorrusso (latino) |
be, be-latn |
| Bemba (Zâmbia) |
bem |
| Bena (Tanzânia) |
bez |
| Bhojpuri-Hindi (Devanagari) |
bho |
| Bikol |
bik |
| Bini |
bin |
| Bislama |
bi |
| Bodo (Devanagari) |
brx |
| Bósnio (latim) |
bs |
| Brajbha |
bra |
| Bretão |
br |
| Búlgaro |
bg |
| Bundeli |
bns |
| buryat (cirílico) |
bua |
| Catalão |
ca |
| Cebuano |
ceb |
| Chamling |
rab |
| Chamorro |
ch |
| Checheno |
ce |
| Chhattisgarhi (Devanagari) |
hne |
| Chiga |
cgg |
| Chinês simplificado |
zh-Hans |
| Chinês (tradicional) |
zh-Hant |
| Choctaw |
cho |
| Chukot |
ckt |
| Chuvash |
cv |
| Córnico |
kw |
| Corso |
co |
| Cree |
cr |
| Creek |
mus |
| Tártaro da Crimeia (latim) |
crh |
| Croata |
hr |
| Crow |
cro |
| Tcheco |
cs |
| Dinamarquês |
da |
| Dargwa |
dar |
| Dari |
prs |
| Dhimal (Devanagari) |
dhi |
| Dogri (Devanágari) |
doi |
| Duala |
dua |
| Dungan |
dng |
| Holandês |
nl |
| Efik |
efi |
| Inglês |
en |
| erzya (cirílico) |
myv |
| Estoniano |
et |
| Feroês |
fo |
| Fijiano |
fj |
| Filipino |
fil |
| Finlandês |
fi |
| Linguagem |
Código (opcional) |
Fon |
fon |
| Francês |
fr |
| Friuliano |
fur |
Ga |
gaa |
| gagauz (latino) |
gag |
| Galego |
gl |
| Ganda |
lg |
| Gayo |
gay |
| Alemão |
de |
| Gilbertês |
gil |
| Gondi (Devanagari) |
gon |
| Grego |
el |
| Groenlandês |
kl |
| Guarani |
gn |
| Gurung (Devanagari) |
gvr |
| Gusii |
guz |
| Crioulo haitiano |
ht |
| Halbi (Devanagari) |
hlb |
| Hani |
hni |
| Haryanvi |
bgc |
| havaiano |
haw |
| Hebraico |
he |
| Herero |
hz |
| Hiligaynon |
hil |
| Híndi |
hi |
| Hmong daw (latim) |
mww |
| Ho(Devanagiri) |
hoc |
| Húngaro |
hu |
| Iban |
iba |
| Islandês |
is |
| Igbo |
ig |
| Iloko |
ilo |
| sami de Inari |
smn |
| Indonésio |
id |
| Ingush |
inh |
| Interlíngua |
ia |
| Inuktitut (Latino) |
iu |
| Irlandês |
ga |
| Italiano |
it |
| Japonês |
ja |
| Jaunsari (Devanagari) |
Jns |
| Javanês |
jv |
| Jola-Fonyi |
dyo |
| Kabardian |
kbd |
| Kabuverdianu |
kea |
| Kachin (latim) |
kac |
| Kalenjin |
kln |
| Kalmyk |
xal |
| Kangri (Devanagari) |
xnr |
| Kanuri |
kr |
| Karachay-Balkar |
krc |
| kara-kalpak (cirílico) |
kaa-cyrl |
| kara-kalpak (latino) |
kaa |
| Cashubiano |
csb |
| cazaque (cirílico) |
kk-cyrl |
| cazaque (latino) |
kk-latn |
| Khakas |
kjh |
| Khaling |
klr |
| Khasi |
kha |
| K'iche' |
quc |
| Kikuyu |
ki |
| Kildin Sami |
sjd |
| Quiniaruanda |
rw |
| Komi |
kv |
| Kongo |
kg |
| Coreano |
ko |
| Korku |
kfq |
| koryak |
kpy |
| kosraean |
kos |
| Kpelle |
kpe |
| Kuanyama |
kj |
| kumyk (cirílico) |
kum |
| Curdo (árabe) |
ku-arab |
| Curdo (latino) |
ku-latn |
| Linguagem |
Código (opcional) |
| Kurukh (Devanagari) |
kru |
| quirguiz (cirílico) |
ky |
Lak |
lbe |
| Lakota |
lkt |
| Latim |
la |
| Letão |
lv |
| Lezghian |
lex |
| Lingala |
ln |
| Lituano |
lt |
| baixo sorábio |
dsb |
| Lozi |
loz |
| sami de Lule |
smj |
| Luo (Quênia e Tanzânia) |
luo |
| Luxemburguês |
lb |
| Luyia |
luy |
| Macedônio |
mk |
| Machame |
jmc |
| Madurese |
mad |
| Mahasu Pahari (Devanagari) |
bfz |
| Makhuwa-Meetto |
mgh |
| Makonde |
kde |
| Malgaxe |
mg |
| Malaio (latino) |
ms |
| Maltês |
mt |
| Malto (Devanagari) |
kmj |
| Mandinka |
mnk |
| Manx |
gv |
| Maori |
mi |
| Mapudungun |
arn |
| Marati |
mr |
| Mari (Rússia) |
chm |
| Masai |
mas |
| Mende (Serra Leoa) |
men |
| Meru |
mer |
| Meta' |
mgo |
| Minangkabau |
min |
| Mohawk |
moh |
| Mongol (Cirílico) |
mn |
| Mongondow |
mog |
| montenegrino (cirílico) |
cnr-cyrl |
| montenegrino (latino) |
cnr-latn |
| Morisyen |
mfe |
| Mundang |
mua |
| Nahuatl |
nah |
| Navajo |
nv |
| Ndonga |
ng |
| Napolitano |
nap |
| Nepali |
ne |
| Ngomba |
jgo |
| niueano |
niu |
| nogay |
nog |
| Ndebele do Norte |
nd |
| sami setentrional (latino) |
sme |
| Norueguês |
no |
| Nianja |
ny |
| Nyankole |
nyn |
| Nzima |
nzi |
| Occitânico |
oc |
| Ojibwa |
oj |
| Oromo |
om |
| osseto |
os |
| Pampanga |
pam |
| Pangasinan |
pag |
| Papiamento |
pap |
| Pashto |
ps |
| Pedi |
nso |
| Persa |
fa |
| Polonês |
pl |
| Português |
pt |
| Punjabi (Árabe) |
pa |
| Quíchua |
qu |
| ripuário |
ksh |
| Romeno |
ro |
| Romanche |
rm |
| Rundi |
rn |
| Russo |
ru |
| Linguagem |
Código (opcional) |
Rwa |
rwk |
| Sadri (Devanagari) |
sck |
| Sakha |
sah |
| Samburu |
saq |
| samoano (latino) |
sm |
| Sango |
sg |
| Sangu (Gabão) |
snq |
| Sânscrito (Devanagari) |
sa |
| Santali(Devanagiri) |
sat |
| Escocês |
sco |
| Gaélico escocês |
gd |
| Sena |
seh |
| Sérvio (cirílico) |
sr-cyrl |
| Sérvio (latino) |
sr, sr-latn |
| Shambala |
ksb |
| Shona |
sn |
| Siksika |
bla |
| Sirmauri (Devanagari) |
srx |
| sami de Skolt |
sms |
| Eslovaco |
sk |
| Esloveno |
sl |
| Soga |
xog |
| Somali (árabe) |
so |
| Somali (latino) |
so-latn |
| Songhai |
son |
| Ndebele do Sul |
nr |
| Altai do Sul |
alt |
| sami do sul |
sma |
| Sotho do Sul |
st |
| Espanhol |
es |
| Sundanês |
su |
| Suaíli (latim) |
sw |
| Swati |
ss |
| Sueco |
sv |
| Tabassaran |
tab |
| Tachelhit |
shi |
| Taitiano |
ty |
| Taita |
dav |
| Tadjique (Cirílico) |
tg |
| Tâmil |
ta |
| Tatar (cirílico) |
tt-cyrl |
| Tártaro (latim) |
tt |
| Teso |
teo |
| Tetum |
tet |
| Tailandês |
th |
| Thani |
thf |
| Tok Pisin |
tpi |
| Tongan |
to |
| Tsonga |
ts |
| Tswana |
tn |
| Turco |
tr |
| turcomeno (latino) |
tk |
| Tuva |
tyv |
| Udmurt |
udm |
| Uighur (cirílico) |
ug-cyrl |
| Ucraniano |
uk |
| Alto sorábio |
hsb |
| Urdu |
ur |
| Uigur (árabe) |
ug |
| Usbeque (árabe) |
uz-arab |
| Uzbeque (cirílico) |
uz-cyrl |
| Uzbeque (latino) |
uz |
| Vietnamita |
vi |
| Volapuque |
vo |
| Vunjo |
vun |
| Walser |
wae |
| Galês |
cy |
| Frísio ocidental |
fy |
| Wolof |
wo |
| Xhosa |
xh |
| Yucatec Maya |
yua |
| Zapoteca |
zap |
| Zarma |
dje |
| Zuangue |
za |
| Zulu |
zu |
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto impresso.
|
Idioma |
Código (opcional) |
| Africâner |
af |
| Angika |
anp |
| Árabe |
ar |
| Asturiano |
ast |
| Awadhi |
awa |
| Azerbaidjano |
az |
| bielorrusso (cirílico) |
be, be-cyrl |
| bielorrusso (latino) |
be-latn |
| Bagheli |
bfy |
| Mahasu Pahari |
bfz |
| Búlgaro |
bg |
| Haryanvi |
bgc |
| Bhojpuri |
bho |
| Bislama |
bi |
| Bundeli |
bns |
| Bretão |
br |
| Braj |
bra |
| Bodo |
brx |
| Bósnio |
bs |
| Buriat |
bua |
| Catalão |
ca |
| Cebuano |
ceb |
| Chamorro |
ch |
| montenegrino (latino) |
cnr, cnr-latn |
| montenegrino (cirílico) |
cnr-cyrl |
| Corso |
co |
| Tártaro da Crimeia |
crh |
| Tcheco |
cs |
| Cashubiano |
csb |
| Galês |
cy |
| Dinamarquês |
da |
| Alemão |
de |
| Dhimal |
dhi |
| Dogri |
doi |
| baixo sorábio |
dsb |
| Inglês |
en |
| Espanhol |
es |
| Estoniano |
et |
| Basco |
eu |
| Persa |
fa |
| Finlandês |
fi |
| Filipino |
fil |
| Linguagem |
Código (opcional) |
| Fijiano |
fj |
| Feroês |
fo |
| Francês |
fr |
| Friuliano |
fur |
| Frísio ocidental |
fy |
| Irlandês |
ga |
| Gagauz |
gag |
| Gaélico escocês |
gd |
| Gilbertês |
gil |
| Galego |
gl |
| Gondi |
gon |
| Manx |
gv |
| Gurung |
gvr |
| havaiano |
haw |
| Híndi |
hi |
| Halbi |
hlb |
| Chhattisgarhi |
hne |
| Hani |
hni |
Ho |
hoc |
| Croata |
hr |
| Alto sorábio |
hsb |
| Haitiano |
ht |
| Húngaro |
hu |
| Interlíngua |
ia |
| Indonésio |
id |
| Islandês |
is |
| Italiano |
it |
| Inuktitut |
iu |
| Japonês |
|
| Jaunsari |
jns |
| Javanês |
jv |
| kara-kalpak (latino) |
kaa, kaa-latn |
| kara-kalpak (cirílico) |
kaa-cyrl |
| Kachin |
kac |
| Kabuverdianu |
kea |
| Korku |
kfq |
| Khasi |
kha |
| cazaque (latino) |
kk, kk-latn |
| cazaque (cirílico) |
kk-cyrl |
| Groelandês |
kl |
| Khaling |
klr |
| Malto |
kmj |
| Linguagem |
Código (opcional) |
| Coreano |
|
| kosraean |
kos |
| koryak |
kpy |
| Karachay-Balkar |
krc |
| Kurukh |
kru |
| Kölsch |
ksh |
| Curdo (latino) |
ku, ku-latn |
| Curdo (árabe) |
ku-arab |
| Kumyk |
kum |
| Córnico |
kw |
| Quirguiz |
ky |
| Latim |
la |
| Luxemburguês |
lb |
| Lakota |
lkt |
| Lituano |
lt |
| Maori |
mi |
| Mongol |
mn |
| Marati |
mr |
| Malaio |
ms |
| Maltês |
mt |
Hmong Daw |
mww |
| Erzya |
myv |
| Napolitano |
nap |
| Nepali |
ne |
| niueano |
niu |
| Holandês |
nl |
| Norueguês |
no |
| Nogai |
nog |
| Occitânico |
oc |
| Ossetian |
os |
| Panjabi |
pa |
| Polonês |
pl |
| Dari |
prs |
| Pushto |
ps |
| Português |
pt |
| K'iche' |
quc |
| Camling |
rab |
| Romanche |
rm |
| Romeno |
ro |
| Russo |
ru |
| Sânscrito |
sa |
| Santali |
sat |
| Linguagem |
Código (opcional) |
| Sadri |
sck |
| Escocês |
sco |
| Eslovaco |
sk |
| Esloveno |
sl |
| Samoano |
sm |
| sami do sul |
sma |
| Sami do Norte |
sme |
| sami de Lule |
smj |
| sami de Inari |
smn |
| sami de Skolt |
sms |
| Somali |
so |
| Albanês |
sq |
| Sérvio (latino) |
sr, sr-latn |
| Sirmauri |
srx |
| Sueco |
sv |
| Swahili |
sw |
| Tetum |
tet |
| Tajik |
tg |
| Thani |
thf |
| Turcomeno |
tk |
| Tonganês |
to |
| Turco |
tr |
| Tártaro |
tt |
| Tuviniano |
tyv |
| Uighur |
ug |
| Urdu |
ur |
| Uzbeque (latino) |
uz, uz-latn |
| Uzbeque (cirílico) |
uz-cyrl |
| Usbeque (árabe) |
uz-arab |
| Volapuque |
vo |
| Walser |
wae |
| Kangri |
xnr |
| Yucateco |
yua |
| Zuangue |
za |
| Chinês (Han (variante simplificada)) |
zh, zh-hans |
| Chinês (Han (variante tradicional)) |
zh-hant |
| Zulu |
zu |
| Linguagem |
Código de idioma |
| Africâner |
af |
| Albanês |
sq |
| Asturiano |
ast |
| Basco |
eu |
| Bislama |
bi |
| Bretão |
br |
| Catalão |
ca |
| Cebuano |
ceb |
| Chamorro |
ch |
| Chinês (Simplificado) |
zh-Hans |
| Chinês (Tradicional) |
zh-Hant |
| Córnico |
kw |
| Corso |
co |
| Tártaro da Crimeia (latim) |
crh |
| Tcheco |
cs |
| Dinamarquês |
da |
| Holandês |
nl |
| Inglês (em letra de forma e manuscrito) |
en |
| Estoniano |
et |
| Fijiano |
fj |
| Filipino |
fil |
| Finlandês |
fi |
| Francês |
fr |
| Friuliano |
fur |
| Galego |
gl |
| Alemão |
de |
| Gilbertês |
gil |
| Groenlandês |
kl |
| Crioulo haitiano |
ht |
| Hani |
hni |
| Hmong daw (latim) |
mww |
| Húngaro |
hu |
| Indonésio |
id |
| Interlíngua |
ia |
| Inuktitut (Latino) |
iu |
| Irlandês |
ga |
| Linguagem |
Código de idioma |
| Italiano |
it |
| Japonês |
ja |
| Javanês |
jv |
| K'iche' |
quc |
| Kabuverdianu |
kea |
| Kachin (latim) |
kac |
| Kara-Kalpak |
kaa |
| Cashubiano |
csb |
| Khasi |
kha |
| Coreano |
ko |
| Curdo (latim) |
kur |
| Luxemburguês |
lb |
| Malaio (latino) |
ms |
| Manx |
gv |
| Napolitano |
nap |
| Norueguês |
no |
| Occitânico |
oc |
| Polonês |
pl |
| Português |
pt |
| Romanche |
rm |
| Escocês |
sco |
| Gaélico escocês |
gd |
| Esloveno |
slv |
| Espanhol |
es |
| Suaíli (latim) |
sw |
| Sueco |
sv |
| Tártaro (latim) |
tat |
| Tetum |
tet |
| Turco |
tr |
| Alto sorábio |
hsb |
| Uzbeque (latino) |
uz |
| Volapuque |
vo |
| Walser |
wae |
| Frísio ocidental |
fy |
| Yucatec Maya |
yua |
| Zuangue |
za |
| Zulu |
zu |
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto manuscrito.
| Linguagem |
Código de idioma (opcional) |
Linguagem |
Código de idioma (opcional) |
| Inglês |
en |
Japonês |
ja |
| Chinês simplificado |
zh-Hans |
Coreano |
ko |
| Francês |
fr |
Português |
pt |
| Alemão |
de |
Espanhol |
es |
| Italiano |
it |
Russo |
ru |
| Tailandês |
th |
Árabe |
ar |
ID do modelo: prebuilt-layout
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto manuscrito.
| Linguagem |
Código de idioma (opcional) |
Linguagem |
Código de idioma (opcional) |
| Inglês |
en |
Japonês |
ja |
| Chinês simplificado |
zh-Hans |
Coreano |
ko |
| Francês |
fr |
Português |
pt |
| Alemão |
de |
Espanhol |
es |
| Italiano |
it |
|
|
Observação
A Informação de Documentos v2.1 não dá suporte à extração de texto manuscrito.
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto manuscrito.
| Linguagem |
Código de idioma (opcional) |
Linguagem |
Código de idioma (opcional) |
| Inglês |
en |
Japonês |
ja |
| Chinês simplificado |
zh-Hans |
Coreano |
ko |
| Francês |
fr |
Português |
pt |
| Alemão |
de |
Espanhol |
es |
| Italiano |
it |
Russo |
ru |
| Tailandês |
th |
Árabe |
ar |
Documentação Geral
Importante
Com o Document Intelligence v4.0:2024-11-30 (GA), o modelo geral de documento (prebuilt-document) está sendo adicionado ao layout (prebuilt-layout). Para extrair pares de chave-valor, marcas de seleção, texto, tabelas e estrutura dos documentos use os seguintes modelos:
| Pares chave-valor |
versão |
ID do modelo |
Modelo de layout com cadeia de caracteres de consulta features=keyValuePairs especificada. |
• v4:2024-11-30 (GA) • v3.1:2023-07-31 (GA) |
prebuilt-layout |
| Modelo de documento geral |
- v3.1:2023-07-31 (GA) - v3.0:2022-08-31 (GA) |
prebuilt-document |
ID do modelo: prebuilt-document
A tabela a seguir lista o suporte ao idioma do modelo de documento geral.
Modelo ID |
Idioma — código de localidade |
Padrão |
|
prebuilt-document |
Inglês (Estados Unidos) -en-US |
Inglês (Estados Unidos) -en-US |