Compartilhar via


Deteção quase duplicada na Deteção de Dados Eletrónicos (Premium)

Importante

As experiências clássicas de Deteção de Dados Eletrónicos foram descontinuadas a 31 de agosto de 2025. Esta descontinuação inclui a Pesquisa de Conteúdos clássica, a Deteção de Dados Eletrónicos clássica (Standard) e a Deteção de Dados Eletrónicos clássica (Premium). Estas opções não estão disponíveis como uma opção de experiência no portal do Microsoft Purview.

A menos que esteja a trabalhar diretamente com a Microsoft ao utilizar estas funcionalidades legadas para cenários de transição de curto prazo específicos, utilize a documentação de orientação para a nova experiência de Deteção de Dados Eletrónicos no portal do Microsoft Purview.

Considere um conjunto de documentos a serem revisados no qual um subconjunto é baseado no mesmo modelo e tem basicamente a mesma linguagem clichê, com algumas diferenças aqui e ali. Se um revisor pudesse identificar este subconjunto, rever um deles cuidadosamente e rever as diferenças para o resto, não teria perdido nenhuma informação exclusiva enquanto demorava apenas uma fração de tempo que os levaria a ler todos os documentos cobertos. Detecção de duplicata próxima agrupa documentos textualmente similares para deixar seu processo de avaliação mais eficiente.

Como funciona?

Quando a detecção de duplicatas próximas é executada, o sistema analisa cada documento com texto. Depois, ela compara os documento entre si para determinar se suas semelhanças são maiores que o limite definido. Se forem maiores, os documentos são agrupados. Depois de todos os documentos serem comparados e agrupados, um documento de cada grupo é marcado como o “original”. Ao analisar seus documentos, você pode analisar primeiro o original e analisar os outros documentos no mesmo conjunto de duplicatas próximas, focando na diferença entre o original e o documento que está sendo analisado.