Entender os recursos predefinidos do serviço de Linguagem do Azure

Concluído

O serviço de Linguagem do Azure fornece vários recursos para entender a linguagem humana. Você pode usar cada recurso para se comunicar melhor com os usuários, entender melhor a comunicação de entrada ou usá-los juntos para fornecer mais informações sobre o que o usuário está dizendo, pretendendo e perguntando.

Os recursos do serviço de Linguagem do Azure se enquadram em duas categorias: recursos pré-configurados e recursos aprendidos. Os recursos aprendidos exigem a criação e o treinamento de um modelo para prever corretamente os rótulos apropriados, que são abordados nas próximas unidades deste módulo.

Esta unidade abrange a maioria dos recursos do serviço de Linguagem do Azure, mas vá até a documentação do serviço de Idioma do Azure para obter uma lista completa, incluindo inícios rápidos e uma explicação completa de tudo o que está disponível.

O uso desses recursos em seu aplicativo requer o envio da consulta para o endpoint apropriado. O endpoint usado para consultar uma funcionalidade específica varia, mas todos eles são prefixados com o recurso de Linguagem do Azure que você criou na sua conta do Azure, seja ao elaborar a sua solicitação REST ou ao definir o seu cliente usando um SDK. Exemplos de cada um deles podem ser encontrados na próxima unidade.

Recursos pré-configurados

O serviço de Linguagem do Azure fornece determinados recursos sem qualquer rotulagem ou treinamento de modelo. Depois de criar seu recurso, você pode enviar seus dados e usar os resultados retornados em seu aplicativo.

Todos os recursos a seguir estão pré-configurados.

Resumo

O resumo está disponível para documentos e conversas e resumirá o texto em frases-chave previstas para encapsular o significado da entrada.

Reconhecimento de entidade nomeada

O reconhecimento de entidade nomeada pode extrair e identificar entidades, como pessoas, locais ou empresas, permitindo que seu aplicativo reconheça diferentes tipos de entidades para respostas de linguagem natural aprimoradas. Por exemplo, no texto "O píer à beira-mar é minha atração favorita de Seattle", Seattle seria identificada e categorizada como um local.

Detecção de PIIs (informações de identificação pessoal)

A detecção de PII permite identificar, categorizar e redigir informações que podem ser consideradas confidenciais, como endereços de email, endereços residenciais, endereços IP, nomes e informações de integridade protegidas. Por exemplo, se o texto "email@contoso.com" foi incluído na consulta, todo o endereço de email poderá ser identificado e redigido.

Extração de frase-chave

A extração de frase-chave é um recurso que extrai rapidamente os principais conceitos do texto fornecido. Por exemplo, dado o texto "Análise de Texto é um dos recursos do Foundry Tools.", o serviço extrairia "Foundry Tools" e "Análise de Texto".

Análise de sentimento

A análise de sentimento identifica o quão positiva ou negativa é uma cadeia de caracteres ou um documento. Por exemplo, no texto "Ótimo hotel. Perto de muitos restaurantes e atrações para ir a pé", o serviço identificaria isso como positivo com uma pontuação de confiança relativamente alta.

Detecção de idioma

A detecção de idioma usa um ou mais documentos e identifica o idioma para cada um deles. Por exemplo, se o texto de um dos documentos fosse "Bonjour", o serviço o identificaria como francês.

Recursos aprendidos

Os recursos aprendidos exigem que você rotule dados, treine e implante seu modelo para disponibilizá-los para uso em seu aplicativo. Esses recursos permitem personalizar quais informações são previstas ou extraídas.

Observação

A qualidade dos dados afeta muito a precisão do modelo. Seja objetivo sobre quais dados são usados, quão bem eles são marcados ou rotulados e quão variados são os dados de treinamento. Para obter detalhes, consulte as recomendações para rotular dados, que inclui diretrizes importantes para marcação de dados. Veja também as métricas de avaliação que podem ajudar a identificar onde seu modelo precisa de melhorias.

CLU (compreensão da linguagem coloquial)

A CLU é um dos principais recursos personalizados oferecidos pelo Azure Language. A CLU ajuda os usuários a compilar modelos de reconhecimento de linguagem natural personalizados para prever a intenção geral e extrair informações importantes de enunciados de entrada. A CLU exige que os dados sejam marcados pelo usuário para ensiná-los a prever intenções e entidades com precisão.

O exercício deste módulo consiste em construir um modelo de CLU e utilizá-lo em seu aplicativo.

Reconhecimento de entidade nomeada personalizada

O reconhecimento de entidade personalizada usa dados rotulados personalizados e extrai entidades especificadas de texto não estruturado. Por exemplo, se tiver vários documentos de contrato dos quais deseja extrair as partes envolvidas, você poderá treinar um modelo para reconhecer como prevê-los.

Classificação personalizada de textos

A classificação de textos personalizada permite que os usuários classifiquem texto ou documentos como grupos definidos personalizados. Por exemplo, você pode treinar um modelo para examinar artigos de notícias e identificar a categoria em que eles devem se enquadrar, como Notícias ou Entretenimento.

Respostas às perguntas

A resposta a perguntas é um recurso pré-configurado que fornece respostas para perguntas fornecidas como entrada. Os dados para responder a essas perguntas são provenientes de documentos como perguntas frequentes ou manuais.

Por exemplo, digamos que você queira criar um assistente de chat virtual no site da sua empresa para responder a perguntas comuns. Você pode usar as perguntas frequentes de uma empresa como o documento de entrada para criar os pares de perguntas e respostas. Depois de implantado, o assistente de chat pode passar perguntas de entrada para o serviço e obter as respostas como resultado.

Para obter uma lista completa de recursos e como usá-los, consulte a documentação do Azure Language.