Partilhar via


O que é classificação de texto personalizada?

A classificação de texto personalizada é uma das funcionalidades personalizadas oferecidas pelo Azure Language no Foundry Tools. É um serviço de API baseado em nuvem que aplica inteligência de aprendizado de máquina para permitir que você crie modelos personalizados para tarefas de classificação de texto.

A classificação de texto personalizada permite que os usuários criem modelos de IA personalizados para classificar o texto em classes personalizadas predefinidas pelo usuário. Ao criar um projeto de classificação de texto personalizado, os desenvolvedores podem rotular dados iterativamente, treinar, avaliar e melhorar o desempenho do modelo antes de disponibilizá-lo para consumo. A qualidade dos dados rotulados afeta muito o desempenho do modelo. Para simplificar a construção e personalização do seu modelo, o serviço oferece uma plataforma unificada para construir, gerir e implementar soluções de IA que podem ser acedidas através do Microsoft Foundry. Você pode facilmente começar com o serviço seguindo as etapas neste início rápido.

A classificação de texto personalizada suporta dois tipos de projetos:

  • Classificação de rótulo único - você pode atribuir uma única classe para cada documento em seu conjunto de dados. Por exemplo, um roteiro de filme só pode ser classificado como "Romance" ou "Comédia".
  • Classificação de vários rótulos - você pode atribuir várias classes para cada documento em seu conjunto de dados. Por exemplo, um roteiro de filme pode ser classificado como "Comédia" ou "Romance" e "Comédia".

Esta documentação contém os seguintes tipos de artigo:

  • Guias de início rápido são instruções iniciais para guiá-lo na realização de solicitações ao serviço.
  • Os conceitos fornecem explicações sobre a funcionalidade e os recursos do serviço.
  • Os guias de instruções contêm instruções para usar o serviço de maneiras mais específicas ou personalizadas.

Exemplos de cenários de utilização

A classificação de texto personalizada pode ser usada em vários cenários em vários setores:

E-mails automáticos ou triagem de bilhetes

Centros de suporte de todos os tipos recebem um grande volume de e-mails ou tíquetes contendo texto não estruturado, de forma livre e anexos. A revisão, o reconhecimento e o encaminhamento oportunos para especialistas no assunto dentro das equipes internas são fundamentais. A triagem de e-mails nessa escala exige que as pessoas analisem e encaminhem para os departamentos certos, o que leva tempo e recursos. A classificação de texto personalizada pode ser usada para analisar o texto recebido e triar e categorizar o conteúdo a ser encaminhado automaticamente para os departamentos relevantes para ações adicionais.

A pesquisa é fundamental para qualquer aplicativo que exponha conteúdo de texto para os usuários. Os cenários comuns incluem pesquisas de catálogos ou documentos, pesquisas de produtos de varejo ou mineração de conhecimento para ciência de dados. Muitas empresas em vários setores estão procurando construir uma experiência de pesquisa rica em conteúdo privado e heterogêneo, que inclui documentos estruturados e não estruturados. Como parte de seu pipeline, os desenvolvedores podem usar a classificação de texto personalizada para categorizar seu texto em classes que são relevantes para seu setor. As classes previstas podem ser usadas para enriquecer a indexação do arquivo para uma experiência de pesquisa mais personalizada.

Ciclo de vida de desenvolvimento do projeto

A criação de um projeto de classificação de texto personalizado normalmente envolve várias etapas diferentes.

O ciclo de vida do desenvolvimento

Siga estes passos para tirar o máximo partido do seu modelo:

  1. Defina seu esquema: conheça seus dados e identifique as classes entre as quais deseja diferenciar, para evitar ambiguidades.

  2. Rotule seus dados: a qualidade da rotulagem de dados é um fator-chave para determinar o desempenho do modelo. Os documentos que pertencem à mesma classe devem ter sempre a mesma classe, se você tiver um documento que pode se enquadrar em duas classes, use projetos de classificação de rótulo múltiplo. Evite a ambiguidade da classe, certifique-se de que suas classes sejam claramente separáveis umas das outras, especialmente com projetos de classificação de rótulo único.

  3. Treinar o modelo: O teu modelo inicia a aprendizagem com os teus dados rotulados.

  4. Visualize o desempenho do modelo: visualize os detalhes da avaliação do seu modelo para determinar o seu desempenho quando introduzido a novos dados.

  5. Implantar o modelo: a implantação de um modelo o torna disponível para uso por meio da API de análise.

  6. Classificar texto: use seu modelo personalizado para tarefas de classificação de texto personalizadas.

Documentação de referência e exemplos de código

Ao utilizar uma classificação de texto personalizada, consulte a seguinte documentação de referência e exemplos para Azure Language no Foundry Tools:

Opção de desenvolvimento / linguagem Documentação de referência Exemplos
APIs REST (criação) Documentação da API REST
APIs REST (tempo de execução) Documentação da API REST
C# (Tempo de execução) Documentação em C# Amostras de C# - Classificação de rótulo únicoAmostras de C# - Classificação de rótulo múltiplo
Java (Tempo de execução) Documentação Java Amostras Java - Classificação de rótulo únicoAmostras Java - Classificação de rótulo múltiplo
JavaScript (Tempo de execução) Documentação do JavaScript Exemplos de JavaScript - Classificação de rótulo únicoExemplos de JavaScript - Classificação de rótulo múltiplo
Python (Tempo de execução) Documentação Python Exemplos de Python - Classificação de rótulo únicoExemplos de Python - Classificação de rótulo múltiplo

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usam, as pessoas afetadas por ela e o ambiente de implantação. Leia a nota sobre transparência para a classificação personalizada de texto para saber mais sobre o uso e a implantação responsáveis da IA nos seus sistemas.

Próximos passos

  • Para começar a usar a classificação de texto personalizada, utilize o artigo de início rápido.

  • Ao percorrer o ciclo de vida de desenvolvimento do projeto, revise o glossário para saber mais sobre os termos usados em toda a documentação para esse recurso.

  • Lembre-se de visualizar os limites de serviço para informações como disponibilidade regional.