Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Importante
- As versões de visualização pública do Azure Language in Foundry Tools fornecem acesso antecipado aos recursos que estão em desenvolvimento ativo.
- Recursos, abordagens e processos podem ser alterados antes da GA (Disponibilidade Geral), com base nos comentários do usuário.
O Language é um serviço baseado em nuvem que aplica recursos de NLP (Processamento de Linguagem Natural) a dados baseados em texto. O recurso nativo de suporte a documentos permite que você envie solicitações de API de forma assíncrona, usando um corpo de solicitação HTTP POST para enviar seus dados e uma cadeia de caracteres de consulta de solicitação HTTP GET para recuperar os resultados de status. Seus documentos processados estão localizados no contêiner de destino do seu Armazenamento de Blobs do Azure.
Um documento nativo se refere ao formato de arquivo usado para criar o documento original, como Microsoft Word (docx) ou um formato portátil de documento (pdf). O suporte a documentos nativos elimina a necessidade de pré-processamento de texto antes de usar recursos de linguagem. Atualmente, o suporte a documentos nativos está disponível para os seguintes recursos:
Informações de identificação pessoal (PII). O recurso de detecção de PII pode identificar, categorizar e redigir informações confidenciais em texto não estruturado. A API
PiiEntityRecognitiondá suporte ao processamento de documentos nativos.Sumarização de documentos. O resumo do documento usa o processamento de linguagem natural para gerar resumos extrativos (extração de frase saliente) ou abstrativos (extração de palavras contextuais) para documentos. As APIs
AbstractiveSummarizationeExtractiveSummarizationdão suporte ao processamento de documentos nativos.
Formatos de documento com suporte
Os aplicativos usam formatos de arquivo nativos para criar, salvar ou abrir documentos nativos. Atualmente, as funcionalidades PII e Sumarização de documentos dão suporte aos seguintes formatos de documento nativo:
| Tipo de arquivo | Extensão de arquivo | Description |
|---|---|---|
| Texto | .txt |
Um documento de texto não formatado. |
| Adobe PDF | .pdf |
Um documento formatado em formato portátil de documento. |
| Microsoft Word | .docx |
Um arquivo de documento do Microsoft Word. |
Diretrizes de entrada
Formatos de arquivo com suporte
| Tipo | suporte e limitações |
|---|---|
| PDFs | PDFs totalmente verificados não têm suporte. |
| Texto em imagens | Não há suporte para imagens digitais com texto incorporado. |
| Tabelas digitais | Não há suporte para tabelas em documentos verificados. |
Tamanho do documento
| Attribute | Limite de entrada |
|---|---|
| Número total de documentos por solicitação | ≤ 20 |
| Tamanho total do conteúdo por solicitação | ≤ 10 MB |
Cabeçalhos e parâmetros de solicitação
| parâmetro | Description |
|---|---|
-X POST <endpoint> |
Especifica o ponto de extremidade de recurso de idioma para acessar a API. |
--header Content-Type: application/json |
Tipo de conteúdo para enviar dados JSON. |
--header "Ocp-Apim-Subscription-Key:<key> |
Especifica a chave de recurso do Azure Language para acessar a API. |
-data |
O arquivo JSON que contém os dados que você deseja passar com sua solicitação. |