Compartilhar via


Perguntas frequentes

Encontrar respostas para perguntas frequentes sobre o Azure Content Understanding

O que é Compreensão de Conteúdo?

Content Understanding é uma nova ferramenta da Foundry projetada para gerar insights estruturados de conteúdo não estruturado usando inteligência artificial. Ela fornece uma experiência consistente para extrair conteúdo ou um esquema estruturado de áudios, vídeos, imagens, documentos ou entradas de texto.

Como funciona a Compreensão de Conteúdo?

A Compreensão de Conteúdo utiliza modelos de IA generativa para analisar e interpretar várias formas de conteúdo não estruturado. Ela integra dados de diferentes modalidades (por exemplo, texto, imagens, áudio) para gerar uma saída coesa e estruturada. O serviço usa modelos de aprendizado de máquina treinados em conjuntos de dados diversos e modelos de IA generativa para garantir alta precisão e relevância nos insights fornecidos.

Quais tipos de conteúdo não estruturado podem ser processados pela Compreensão de Conteúdo?

A Compreensão de Conteúdo pode processar uma ampla gama de conteúdo não estruturado, incluindo, mas não se limitando a:

  • Gravações de áudio
  • Conteúdo de vídeo
  • Documentos
  • Conteúdo de texto
  • Imagens

Quais são os principais benefícios do uso da Compreensão de Conteúdo?

Os principais benefícios do uso da Compreensão de Conteúdo incluem:

  • Pontuações de confiança: verifique a precisão dos valores extraídos, minimizando o custo da revisão humana.
  • Esquema definido: defina um esquema para garantir que os valores extraídos estejam alinhados com o uso pretendido.
  • Fundamento: rastreia cada campo extraído ou gerado para seu local de origem no documento.
  • Aprendizado no contexto: aprimore a qualidade da extração em novos modelos fornecendo alguns exemplos rotulados sem treinar novamente.
  • Melhorias de qualidade ao longo do tempo: o serviço fornece recursos para melhorar a qualidade do esquema extraído.
  • Melhoria na tomada de decisões: os insights estruturados ajudam as organizações a tomar decisões informadas de forma rápida e eficaz.
  • Maior eficiência: automatizar a análise de conteúdo não estruturado economiza tempo e reduz o esforço manual necessário.
  • Escalabilidade: o serviço pode lidar com grandes volumes de dados, tornando-o adequado para organizações de todos os tamanhos.

Como as empresas podem usar a Compreensão de Conteúdo?

As empresas podem usar a Compreensão de Conteúdo de várias maneiras, como:

  • Automação: automatize o processamento de conteúdo para extrair um esquema definido. Call center, documentos e outros cenários semelhantes.
  • Catalogação de conteúdo: gerenciamento de um grande corpus de ativos digitais.
  • Análise de sentimento do cliente: compreensão dos comentários do cliente a partir das avaliações, redes sociais e interações de suporte.
  • Pesquisa de mercado: análise de tendências e padrões de diversas fontes de dados para informar estratégias de negócios.
  • Insights operacionais: obtenha insights de documentos internos, emails e outros dados não estruturados para melhorar as operações.

É fácil integrar a Compreensão de Conteúdo aos sistemas existentes?

Sim, a Compreensão de Conteúdo integra-se facilmente aos sistemas e fluxos de trabalho existentes. Por exemplo:

  • Pesquisa de IA do Azure 
  • Microsoft Fabric
  • Serviço de Agente da Fábrica
  • Aplicativo Lógico do Azure

O serviço oferece um conjunto de APIs fáceis de usar que podem ser integradas a qualquer aplicativo. Veja exemplos de código no GitHub.

Quais medidas de segurança estão em vigor para proteger os dados processados pela Compreensão de Conteúdo?

Ferramentas Foundry, incluindo a Compreensão de Conteúdo, aderem a rigorosos padrões de segurança e conformidade para garantir a proteção de dados. Essas medidas incluem criptografia de dados, controles de acesso seguro e conformidade com regulamentos do setor, como HIPAA. O serviço também segue o uso responsável de IA pela Microsoft.

Quais modelos base o Azure Content Understanding usa?

O Content Understanding usa uma combinação de modelos para processar seu conteúdo:

  • Modelos do Foundry: você traz suas próprias implantações de modelos de linguagem grandes (LLMs) e incorporações do Foundry. O Content Understanding dá suporte à família de modelos GPT-4o e GPT-4.1 e aos modelos de inserção OpenAI. Consulte o artigo de implantações de modelo para obter a lista completa de modelos com suporte.
  • Outros modelos base: o Reconhecimento de Conteúdo também usa vários recursos, incluindo serviços de Fala, Visão e Linguagem, para dar suporte à extração e ao processamento de conteúdo em diferentes modalidades.

Quais são as opções de nível de preços para o Content Understanding?

O Content Understanding usa um modelo de preço transparente baseado em uso com duas categorias de cobrança principais:

  • Extração de conteúdo: encargos por unidade de entrada processada (por 1.000 páginas para documentos, por minuto para áudio/vídeo).
  • Recursos generativos: ao usar recursos alimentados por IA, você incorre em encargos de contextualização (taxa fixa por unidade de conteúdo) mais encargos baseados em token de suas implantações de modelo do Microsoft Foundry (tokens de entrada/saída e inserções).

Para obter informações detalhadas sobre preços, exemplos e dicas de otimização de custo, consulte a página de preços do explicador de preços e do Content Understanding.

Como os recursos de detecção facial na Compreensão de Conteúdo diferem do serviço de Detecção Facial com IA do Azure?

Na versão da API ga (2025-11-01), o Content Understanding fornece recursos relacionados ao rosto voltados para privacidade e descrição em vez de identificação:

  • Desfoque de rosto: por padrão, desfoca automaticamente rostos no conteúdo de vídeo e imagem para proteger a privacidade.
  • Descrição da face: use modelos geradores para gerar descrições textuais de rostos em seu conteúdo, capturando atributos, características e identificação de celebridades.

O Reconhecimento de Conteúdo não inclui os recursos completos do serviço de Detecção Facial de IA do Azure, como reconhecimento facial, verificação, identificação ou recursos de diretório de pessoas nesta versão da API.