Partilhar via


Escolha uma tecnologia de processamento de linguagem direcionada da IA do Azure

Os serviços de IA do Azure ajudam os programadores e as organizações a criar rapidamente aplicações inteligentes, inovadoras, prontas para o mercado e responsáveis com APIs e modelos prontos a utilizar, pré-construídos e personalizáveis.

Este artigo aborda os serviços de IA que fornecem recursos de processamento de linguagem direcionados, como processamento de linguagem natural (NLP), análise de texto, compreensão de idiomas, tradução e extração de dados de documentos. O Microsoft Azure AI Language é uma das categorias mais amplas em serviços de IA. Você pode usar as APIs em sua carga de trabalho para incorporar recursos de linguagem como reconhecimento de entidade nomeada (NER), análise de sentimento, deteção de idioma e resumo de texto.

Serviços

Os seguintes serviços fornecem recursos de processamento de linguagem direcionados para serviços de IA:

  • A linguagem fornece PNL para análise de texto.

    • Utilização Idioma quando você precisa trabalhar com documentos estruturados ou não estruturados para a ampla gama de tarefas relacionadas ao idioma descritas neste artigo.

    • Não utilize Idioma se você precisar pesquisar documentos com bate-papo, verifique-os quanto à segurança do conteúdo ou traduzi-los.

  • O Microsoft Azure AI Translator é um serviço de tradução automática. Ele pode executar tradução de texto em tempo real, tradução de documentos em lote e de arquivo único e traduções personalizadas que você pode usar para incorporar terminologia especializada ou linguagem específica do setor para o seu cenário. O Translator suporta vários idiomas.

    • Utilização Tradutor quando você precisa realizar a tradução especificamente. Você pode usar outros modelos de linguagem de base de uso geral para executar a tradução. Mas usar o Translator para o seu propósito especializado pode ser mais eficaz e rentável devido aos seus modelos de tradução direcionados.

    • Não utilize Tradutor se você precisar se envolver com o bate-papo, analisar o conteúdo em busca de sentimento ou moderar conteúdo. Para análise de sentimento, use Language em vez disso. Para moderação de conteúdo, use o Microsoft Azure AI Content Safety.

  • O Azure AI Document Intelligence é um serviço que pode converter imagens diretamente em formulários eletrônicos. Você pode especificar os campos esperados e, em seguida, pesquisar imagens fornecidas para capturar esses campos sem intervenção humana. O Document Intelligence hospeda muitos modelos pré-construídos e também permite que você crie seus próprios modelos personalizados.

    • Utilização Inteligência Documental quando você sabe exatamente quais campos precisa extrair de documentos digitalizados para preencher formulários eletrônicos adequadamente.

    • Utilização Document Intelligence para identificar estruturas-chave, como cabeçalhos, rodapés e quebras de capítulo, em coleções variadas de documentos para interagir programaticamente com o documento, como em uma implementação de geração aumentada de recuperação (RAG).

    • Não utilize Document Intelligence como uma API de pesquisa em tempo real.

Azure OpenAI em modelos de fundição

O Azure OpenAI em Foundry Models fornece acesso à API REST aos poderosos modelos de linguagem da OpenAI. Estes modelos incluem O3-Mini, O1, O1-Mini, GPT-4o, GPT-4o Mini, GPT-4 Turbo com Visão, GPT-4, GPT-3.5-Turbo e a série de modelos Embeddings. Esses modelos são altamente adaptáveis, o que permite personalizá-los para tarefas como geração de conteúdo, sumarização, análise de imagens e pesquisa semântica. Eles também suportam linguagem natural para tradução de código, o que os torna versáteis para várias aplicações.

Capacidades

A tabela a seguir fornece uma lista de recursos disponíveis no Azure OpenAI.

Capacidade Descrição
Geração e preenchimento de texto Gera texto semelhante ao humano com base em prompts, completa automaticamente frases ou parágrafos, resume documentos longos em resumos concisos e responde a perguntas com base no contexto.
Bate-papo Crie chatbots e assistentes virtuais, mantenha o contexto em conversas de vários turnos e personalize as respostas com base na interação do usuário.
Assistentes Crie uma experiência semelhante a um copiloto que mantenha uma personalidade consistente nas interações do usuário. Permitir o uso de várias ferramentas simultaneamente, como implementação de código e pesquisa de conhecimento.
Incorporações Converta texto em vetores numéricos onde significados semelhantes são posicionados próximos uns dos outros no espaço vetorial. Esse processo permite uma poderosa pesquisa de semelhança em serviços como Azure AI Search, Azure Cosmos DB, Banco de Dados SQL do Azure e Banco de Dados do Azure para PostgreSQL.
Filtragem de conteúdo Analisa as entradas do utilizador e as saídas de IA em busca de conteúdo nocivo em categorias como ódio, conteúdo sexual, violência e automutilação, com suporte para vários idiomas. Ele também monitora padrões de uso para ajudar a garantir a conformidade.
Personalização LLM Fornece técnicas de adaptação de modelo, incluindo engenharia imediata para ajustes rápidos, RAG para incorporar informações externas e ajuste fino para treinar o modelo em tarefas especializadas. Você pode combinar esses métodos para otimizar o desempenho para casos de uso específicos.

Linguagem

Language é um serviço baseado em nuvem que fornece recursos de PNL para compreensão e análise de texto. Use este serviço para ajudar a criar aplicativos inteligentes usando o Language Studio baseado na Web, APIs REST e bibliotecas de cliente.

Capacidades

A tabela a seguir fornece uma lista de recursos disponíveis em Idioma.

Capacidade Descrição
Resposta a perguntas personalizadas Encontra a resposta mais apropriada para as entradas de seus usuários. É comumente usado para criar aplicativos cliente de conversação, como aplicativos de mídia social, bots de bate-papo e aplicativos de desktop habilitados para fala.
Classificação de texto personalizada Cria modelos de IA personalizados para classificar documentos de texto não estruturados em classes personalizadas que você define.
Compreensão de linguagem conversacional (CLU) Crie modelos personalizados de compreensão de linguagem natural para prever a intenção geral de uma mensagem recebida e extrair informações importantes dela.
Ligação de entidades Desambigua a identidade de palavras ou frases encontradas em texto não estruturado e retorna links para a Wikipédia.
Deteção de idioma Deteta o idioma em que um documento está escrito e retorna um código de idioma para uma ampla gama de idiomas, variantes, dialetos e alguns idiomas regionais ou culturais.
Extração de expressões-chave Avalia e retorna os principais conceitos em texto não estruturado e os retorna como uma lista.
NER Categoriza palavras ou frases em texto não estruturado em vários grupos de categorias predefinidas, como pessoas, eventos, locais e datas.
Fluxo de trabalho de orquestração Use para conectar o CLU.
Informações de identificação pessoal (PII) e deteção de informações de saúde de identificação pessoal Identifica, categoriza e redige informações confidenciais em documentos de texto não estruturados e transcrições de conversas, como números de telefone, endereços de e-mail e formas de identificação. Para obter mais informações, consulte Categorias de entidades PII suportadas.
Análise de sentimento e mineração de opinião Ajuda você a entender o que as pessoas pensam da sua marca ou tópico, analisando o texto em busca de sinais de sentimento positivo ou negativo e vinculando-os a aspetos específicos do conteúdo.
Resumo Utiliza resumo de texto extrativo para produzir um sumário de documentos e transcrições de conversas. Ele extrai frases que representam coletivamente as informações mais importantes ou relevantes dentro do conteúdo original.
Análise de texto para a saúde Extrai e rotula informações médicas relevantes de textos não estruturados, como anotações médicas, resumos de alta, documentos clínicos e registros de saúde eletrônicos. Ao projetar sua carga de trabalho, avalie o local de processamento e a residência de dados desse recurso hospedado na nuvem para garantir que ele esteja alinhado com suas expectativas de conformidade. Algumas cargas de trabalho podem ser restritas em sua capacidade de enviar dados de saúde para uma plataforma hospedada na nuvem. Você pode usar essa API como um contêiner do Docker para hospedar sua própria computação na nuvem ou localmente. Esse processo pode ajudar a resolver problemas de conformidade que incluem a plataforma como um serviço. Para obter mais informações, consulte Usar a Análise de Texto para contêineres de integridade.

Casos de utilização

A tabela a seguir fornece uma lista de possíveis casos de uso para Language.

Caso de utilização Personalizável
Preveja a intenção das entradas do usuário e extraia informações delas. Sim
Identifique e elimine informações confidenciais, como PII.
Identifique o idioma em que um texto foi escrito.
Extraia informações médicas de documentos clínicos ou médicos sem construir um modelo.
Extraia informações médicas de documentos clínicos ou médicos usando um modelo treinado em seus dados. Sim
Extraia categorias de informações sem criar um modelo personalizado.
Extraia categorias de informações usando um modelo específico para seus dados. Sim
Extraia tópicos principais e frases importantes.
Resumir um documento.
Classifique o texto usando a análise de sentimento. Sim
Classifique o texto usando classes personalizadas. Sim
Classifique os itens em categorias fornecidas no momento da inferência.
Vincular uma entidade a artigos da base de dados de conhecimento.
Compreender perguntas e respostas (genéricas). Sim
Crie um aplicativo de conversação que responda às entradas do usuário.
Conecte aplicativos da CLU e responda a perguntas. Sim

Se um recurso for personalizável, você pode treinar um modelo de IA usando nossas ferramentas para ajustar seus dados específicos. Caso contrário, o recurso é pré-configurado, o que significa que seus modelos de IA permanecem inalterados. Você fornece seus dados e usa a saída do recurso em seus aplicativos.

Tradução

O Translator é um serviço de tradução automática que faz parte dos serviços de IA. O Translator capacita muitos produtos e serviços da Microsoft.

Capacidades

A tabela a seguir fornece uma lista de recursos disponíveis no Translator.

Capacidade Descrição
Tradução de texto do Azure Realize a tradução de texto entre os idiomas de origem e de destino suportados em tempo real. Crie um dicionário dinâmico e saiba como impedir traduções usando a API do Translator.
Tradução de documentos Tradução assíncrona em lote: Traduza arquivos em lote e complexos, preservando a estrutura e o formato dos documentos originais. O processo de tradução em lote requer uma conta de Armazenamento de Blob do Azure que tenha contêineres para seus documentos de origem e traduzidos.
Tradução síncrona de arquivo único: Traduza um único arquivo de documento sozinho ou com um arquivo de glossário, preservando a estrutura e o formato do documento original. O processo de tradução de arquivos não requer uma conta de armazenamento de Blob. A resposta final contém o documento traduzido e é devolvida diretamente ao cliente chamador.
Tradutor Personalizado Crie modelos personalizados para traduzir linguagem, terminologia e estilo específicos do domínio e do setor. Crie um dicionário (frase ou frase) para traduções personalizadas.

Casos de utilização

A tabela a seguir fornece uma lista de possíveis casos de uso do Translator.

Caso de utilização Documentação
Traduzir texto específico do setor. Tradutor Personalizado
Traduza texto genérico que não é específico de um setor. Tradução de texto do Azure

Inteligência Documental

Language é um serviço baseado em nuvem que fornece recursos de PNL para compreensão e análise de texto. Use este serviço para ajudar a criar aplicativos inteligentes usando o Language Studio baseado na Web, APIs REST e bibliotecas de cliente.

Capacidades

A tabela a seguir fornece uma lista de alguns dos recursos disponíveis no Document Intelligence.

Capacidade Descrição
Extração de cartão de visita O modelo de cartão de visita Document Intelligence combina recursos de Reconhecimento Ótico de Caracteres (OCR) com modelos de aprendizagem profunda para analisar e extrair dados de imagens de cartões de visita. A API analisa cartões de visita impressos, extrai informações importantes, como nome, sobrenome, nome da empresa, endereço de e-mail e número de telefone, e retorna uma representação de dados JSON estruturada.
Extração do modelo de contrato O modelo de contrato de Inteligência Documental usa recursos de OCR para analisar e extrair campos-chave e itens de linha de um grupo selecionado de entidades contratuais importantes. Os contratos podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento, extrai informações importantes, como partes, jurisdições, ID do contrato e título, e retorna uma representação de dados JSON estruturada. Atualmente, o modelo suporta formatos de documentos em inglês.
Extração de cartão de crédito O modelo de cartão de crédito/débito da Document Intelligence usa recursos de OCR para analisar e extrair campos-chave de cartões de crédito e débito. Os cartões de crédito e débito podem aparecer em vários formatos e qualidades, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento, extrai informações importantes, como número do cartão, banco emissor e data de validade, e retorna uma representação de dados JSON estruturada. Atualmente, o modelo suporta formatos de documentos em inglês.
Extração do cartão do seguro de saúde O modelo de cartão de seguro de saúde Document Intelligence combina recursos de OCR com modelos de aprendizado profundo para analisar e extrair informações importantes de cartões de seguro de saúde dos EUA. Um cartão de seguro de saúde é um documento fundamental para o processamento de cuidados e pode ser analisado digitalmente para integração do paciente, informações de cobertura financeira, pagamentos sem dinheiro e processamento de solicitações de seguro. O modelo de cartão de seguro de saúde analisa imagens de cartão de saúde, extrai informações importantes, como seguradora, membro, prescrição e número de grupo e, em seguida, retorna uma representação JSON estruturada. Os cartões de seguro de saúde podem aparecer em vários formatos e qualidades, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais.
Extração de documentos fiscais dos EUA O modelo de contrato de Inteligência Documental usa recursos de OCR para analisar e extrair campos-chave e itens de linha de um grupo selecionado de documentos fiscais. Os documentos fiscais podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento, extrai informações importantes, como nome do cliente, endereço de cobrança, data de vencimento e valor devido e, em seguida, retorna uma representação de dados JSON estruturada. Atualmente, o modelo suporta formatos específicos de documentos fiscais em inglês.
Bibliotecas de clientes A Inteligência de Documentos suporta uma vasta gama de modelos que lhe permitem adicionar processamento inteligente de documentos às suas aplicações e fluxos. Você pode usar um modelo específico de domínio pré-criado ou treinar um modelo personalizado adaptado às suas necessidades de negócios e casos de uso específicos. O Document Intelligence pode ser usado com a API REST ou bibliotecas de clientes Python, C#, Java e JavaScript.

Para obter mais informações sobre cenários de modelo, consulte Qual modelo devo escolher?

Próximos passos