Compartilhar via


Suporte a documentos nativos para o Azure Language nas Foundry Tools (versão prévia)

Importante

  • As versões de visualização pública do Azure Language in Foundry Tools fornecem acesso antecipado aos recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem ser alterados antes da GA (Disponibilidade Geral), com base nos comentários do usuário.

O Language é um serviço baseado em nuvem que aplica recursos de NLP (Processamento de Linguagem Natural) a dados baseados em texto. O recurso nativo de suporte a documentos permite que você envie solicitações de API de forma assíncrona, usando um corpo de solicitação HTTP POST para enviar seus dados e uma cadeia de caracteres de consulta de solicitação HTTP GET para recuperar os resultados de status. Seus documentos processados estão localizados no contêiner de destino do seu Armazenamento de Blobs do Azure.

Um documento nativo se refere ao formato de arquivo usado para criar o documento original, como Microsoft Word (docx) ou um formato portátil de documento (pdf). O suporte a documentos nativos elimina a necessidade de pré-processamento de texto antes de usar recursos de linguagem. Atualmente, o suporte a documentos nativos está disponível para os seguintes recursos:

  • Informações de identificação pessoal (PII). O recurso de detecção de PII pode identificar, categorizar e redigir informações confidenciais em texto não estruturado. A API PiiEntityRecognition dá suporte ao processamento de documentos nativos.

  • Sumarização de documentos. O resumo do documento usa o processamento de linguagem natural para gerar resumos extrativos (extração de frase saliente) ou abstrativos (extração de palavras contextuais) para documentos. As APIs AbstractiveSummarization e ExtractiveSummarization dão suporte ao processamento de documentos nativos.

Formatos de documento com suporte

Os aplicativos usam formatos de arquivo nativos para criar, salvar ou abrir documentos nativos. Atualmente, as funcionalidades PII e Sumarização de documentos dão suporte aos seguintes formatos de documento nativo:

Tipo de arquivo Extensão de arquivo Description
Texto .txt Um documento de texto não formatado.
Adobe PDF .pdf Um documento formatado em formato portátil de documento.
Microsoft Word .docx Um arquivo de documento do Microsoft Word.

Diretrizes de entrada

Formatos de arquivo com suporte

Tipo suporte e limitações
PDFs PDFs totalmente verificados não têm suporte.
Texto em imagens Não há suporte para imagens digitais com texto incorporado.
Tabelas digitais Não há suporte para tabelas em documentos verificados.

Tamanho do documento

Attribute Limite de entrada
Número total de documentos por solicitação ≤ 20
Tamanho total do conteúdo por solicitação ≤ 10 MB

Cabeçalhos e parâmetros de solicitação

parâmetro Description
-X POST <endpoint> Especifica o ponto de extremidade de recurso de idioma para acessar a API.
--header Content-Type: application/json Tipo de conteúdo para enviar dados JSON.
--header "Ocp-Apim-Subscription-Key:<key> Especifica a chave de recurso do Azure Language para acessar a API.
-data O arquivo JSON que contém os dados que você deseja passar com sua solicitação.