Criar um classificador treinável personalizado

Concluído

Muitas vezes, as organizações precisam de classificar dados não estruturados que não seguem padrões previsíveis. Os classificadores treináveis personalizados permitem-lhe preparar o Microsoft Purview para reconhecer conteúdos exclusivos ao fornecer documentos de exemplo para análise baseada em IA. Depois de preparados, os classificadores podem ser utilizados para atribuir automaticamente conteúdos, aplicar políticas de retenção e suportar a conformidade de comunicação.

Como funcionam os classificadores treináveis

Os classificadores treináveis utilizam machine learning para detetar conteúdos com base no significado e no contexto, em vez de padrões predefinidos. Ao contrário dos tipos de informações confidenciais (SITs), que dependem de palavras-chave ou de deteção baseada em padrões, os classificadores treináveis melhoram a precisão da classificação através da análise de exemplos do mundo real.

A criação de um classificador envolve a preparação de um modelo com conteúdo de exemplo, incluindo documentos relevantes e irrelevantes. Este processo ajuda o modelo a distinguir entre dados que pertencem a uma categoria de classificação e dados que não pertencem.

Requisitos

Antes de criar um classificador, certifique-se de que cumpre os requisitos de licenciamento e permissão.

Licenciamento

Os classificadores treináveis no Microsoft Purview necessitam de uma das seguintes combinações de licenças:

  • Microsoft 365 E5
  • Conformidade do Microsoft 365 E5
  • Microsoft 365 E3 com o suplemento Proteção de Informações do Microsoft Purview e Governação

Estas licenças incluem o acesso a funcionalidades de classificação avançadas, como classificadores treináveis, correspondência de dados exata, entidades nomeadas e análise contextual.

Permissões

Para criar e gerir classificadores treináveis, os utilizadores têm de ter as permissões de função adequadas. As permissões necessárias dependem do local onde o classificador será utilizado.

Cenário Permissões de função necessárias
Política de etiqueta de retenção Gestão de Registos, Gestão de Retenção
Política de etiquetas de confidencialidade Administrador de Segurança, Administrador de Conformidade, Administrador de Dados de Conformidade
Política de conformidade de comunicações Administrador de Gestão de Riscos Internos, Administrador de Revisão de Supervisão

Importante

Por predefinição, apenas o utilizador que cria um classificador personalizado pode preparar e rever as predições feitas por esse classificador.

Passos para criar um classificador treinável

A criação de um classificador segue um processo estruturado que inclui preparação, teste e publicação.

Passo 1: recolher dados de preparação

Para preparar o classificador, tem de fornecer dois conjuntos de dados de exemplo selecionados manualmente pelos utilizadores:

  • Exemplos positivos (50 a 500 itens): documentos que pertencem à categoria.
  • Exemplos negativos (150 a 1500 itens): documentos que não pertencem à categoria.

Dica

Quanto mais diversos e bem selecionados forem os dados de preparação, mais preciso será o classificador.

Passo 2: armazenar dados no SharePoint

Armazene os exemplos positivos e negativos em pastas separadas do SharePoint . Certifique-se de que estas pastas contêm apenas os respetivos dados de preparação.

Observação

Se criar novas pastas, aguarde pelo menos uma hora pela indexação antes de as utilizar na configuração do classificador.

Passo 3: criar o classificador treinável

  1. Inicie sessão no portal do Microsoft Purview .
  2. Navegue para Proteção de Informações>Classifiers>Classificadores treináveis.
  3. Selecione Criar classificador treinável.
  4. Introduza um nome e uma descrição.
  5. Adicione o URL da pasta do SharePoint para obter exemplos positivos e selecione Seguinte.
  6. Adicione o URL da pasta do SharePoint para obter exemplos negativos e selecione Seguinte.
  7. Examine as configurações e selecione Criar classificador treinável.

Depois de criado, o classificador começa a processar os dados de preparação. O tempo de processamento varia, mas normalmente é concluído dentro de 24 horas.

Passo 4: Rever e testar o classificador

Assim que o classificador processar amostras positivas e negativas suficientes, tem de verificar as predições.

  1. Abra o classificador e reveja os resultados.
  2. Confirme se cada predição está correta, incorreta ou incerta.
  3. A Microsoft utiliza este feedback para refinar o modelo de classificação.

Dica

Pelo menos 200 itens de teste devem ser revistos para obter a melhor precisão.

Passo 5: publicar o classificador

Quando satisfeito com a precisão do classificador:

  1. Selecione Publicar para utilização.
  2. O classificador fica disponível para:
    • Políticas de etiquetas automáticas
    • Políticas de retenção
    • Prevenção de perda de dados (DLP)
    • Conformidade de comunicações

O classificador identifica e categoriza automaticamente o conteúdo com base na sua preparação.

Melhores práticas para classificadores treináveis personalizados

  • Garantir diversos exemplos de preparação: inclua um intervalo de conteúdos que represente com precisão a categoria de classificação.
  • Evitar o sobreajuste: não utilize demasiados documentos semelhantes; A diversidade melhora a flexibilidade do classificador.
  • Rever e voltar a preparar regularmente: à medida que o conteúdo muda, atualize os classificadores para manter a precisão.
  • Utilizar, pelo menos, 200 itens de teste: para obter os melhores resultados, tenha, pelo menos, 200 itens no conjunto de exemplos de teste que inclua, pelo menos, 50 exemplos positivos e, pelo menos, 150 exemplos negativos. Isto melhora a confiança nas predições antes da publicação.