Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Importante
Traduções não em inglês são fornecidas apenas para conveniência. Consulte a EN-US versão deste documento para obter a versão definitiva.
Um sistema de IA (inteligência artificial) inclui não apenas a tecnologia, mas também as pessoas que a usarão, as pessoas que serão afetadas por ela e o ambiente no qual ela é implantada. Criar um sistema adequado para sua finalidade pretendida requer uma compreensão de como a tecnologia funciona, quais são suas funcionalidades e limitações e como alcançar o melhor desempenho. As Notas de Transparência da Microsoft destinam-se a ajudá-lo a entender como nossa tecnologia de IA funciona, as opções que os proprietários do sistema podem fazer que influenciam o desempenho e o comportamento do sistema e a importância de pensar em todo o sistema, incluindo a tecnologia, as pessoas e o ambiente. Você pode usar Notas de Transparência ao desenvolver ou implantar seu próprio sistema ou compartilhá-las com as pessoas que usarão ou serão afetadas pelo seu sistema.
As Notas de Transparência da Microsoft fazem parte de um esforço mais amplo da Microsoft para colocar nossos princípios de IA em prática. Para saber mais, confira os princípios de IA da Microsoft.
Fundamentos do Tradutor do Azure no Foundry Tools
Introdução
O Tradutor é um serviço de IA que converte o texto de uma linguagem natural para outra. Na literatura de machine learning, esse processo é chamado de tradução automática. A aplicação de técnicas de IA tornou a tradução automática entre idiomas significativamente melhor nos últimos 70 anos de pesquisa de tradução automática, a ponto de apresentarmos o resultado da tradução automática para destinatários humanos para consumo direto, sem edições, em alguns casos de uso.
O Tradutor fornece uma API que permite que você traduza de um idioma para outro idioma ou para vários idiomas ao mesmo tempo.
Internamente, cada tradução de idioma é executada como um ato separado. Você pode traduzir entre qualquer um dos mais de 135 idiomas e dialetos oferecidos pelo Tradutor.
Os sistemas de tradução de treinamento dependem da disponibilidade de dados entre pares de idiomas. Criamos sistemas bilíngues (sistemas de tradução entre dois idiomas) ou sistemas multilíngues (sistemas de tradução em várias linguagens relacionadas). Com base na qualidade do modelo, o serviço escolherá o caminho ideal para uma tradução específica solicitada pelo usuário.
A conversão entre alguns pares pode envolver um pivô por meio de um terceiro idioma. Por exemplo, a tradução entre Suaíli e Hindi pode envolver a tradução de suaíli para o inglês, seguida pela tradução do inglês para o hindi. Esse processo é feito automaticamente dentro do serviço.
Principais termos
| Prazo | Definição |
|---|---|
| Caractere | A API de Tradutor conta cada ponto de código definido no Unicode como um caractere. |
| Frase de texto | Uma frase completa ou parcial. |
| Documento | Uma coleção de texto em um formato de arquivo digital, incluindo, mas não se limitando ao documento do Word, planilha do Excel, apresentação do PowerPoint, Adobe PDF, HTML, Texto e Markdown. |
| Estilo e registro | A maneira de ortografia/pontuação do texto, que pode afetar a qualidade da tradução. |
Capacidades
Comportamento do sistema
O Tradutor tem recursos para:
- Traduzir texto em vários idiomas.
- Translitera texto de um script para outro.
- Traduza de forma assíncrona lotes de documentos grandes em vários idiomas que retêm estrutura e layout como no documento de origem.
- Traduza de forma síncrona um único documento em um idioma de destino que retém a estrutura e o layout como no documento de origem.
Casos de uso
Usos previstos
As seguintes classes de casos de uso de tradução são fornecidas para ajudá-lo a pensar em seus próprios cenários:
Tradução de saída: um editor de informações fornece documentos ou texto em vários idiomas, abordando o público-alvo no idioma do destinatário. Há diferentes classes e formatos de material de saída, por exemplo, folhetos de marketing, vídeos informativos ou manuais de chão de fábrica. A tradução automática é mais adequada para algumas classes do que para outras. Como regra geral, a adequação da tradução automática é inversamente proporcional à criatividade do conteúdo. A tradução pode ser publicada como conteúdo da Web, um documento eletrônico ou como legendas de vídeo ou dublagem ou ser impressa no papel.
- Tradução bruta: publique a tradução conforme entregue pelo sistema de tradução automática. Esse caso de uso tem o menor custo e vem com uma taxa de erro não insignificante. Deve haver mecanismos em vigor para reagir a erros de tradução, como comentários dos consumidores.
- Tradução pós-editada: publique a tradução pós-editada, que é o resultado da tradução automática corrigido por um revisor humano. A intervenção humana aumenta o custo sobre a tradução bruta em um fator de mais de 1.000, mas reduz significativamente a taxa de erros e melhora a fluência e a compreensão da tradução.
Tradução de entrada: alguém recebe informações em um idioma estrangeiro e usa o Tradutor para traduzir as informações para seu idioma nativo. Exemplos são sites, avaliações de produtos, relatórios financeiros e comerciais ou relatórios de bugs que chegam em um idioma estrangeiro. A tolerância a erros de tradução pode ser maior nesse caso de uso, mas a tradução pode induzir mal-entendidos significativos em um número não insignificante de casos. Geralmente, nesse cenário, uma tradução automática é melhor do que nenhuma tradução. Um indivíduo ou uma empresa pode filtrar ou classificar automaticamente para extrair informações ou aplicar outras técnicas de IA em documentos de várias fontes, incluindo documentos em idiomas estrangeiros. Exemplos podem ser monitoramento de mídia, assistentes virtuais multilíngues ou descoberta eletrônica. O destinatário aplica a tradução automática antes de passar o documento para a análise automática. Na maioria das vezes, esse processo é totalmente automatizado sem intervenção humana.
Tradução bidirecional: dois ou mais humanos que não falam o mesmo idioma empregam tradução automática em um chat ao vivo por mensagens instantâneas ou em uma conversa falada. Por exemplo, um agente de suporte não fala o mesmo idioma que o cliente que busca ajuda.
Sequenciando várias Foundry Tools:
- Tradução de fala: o Azure Speech, uma das Ferramentas Foundry, pode traduzir fala entre idiomas. A fala gera a transcrição no mesmo idioma da fala original e, em seguida, emprega internamente o Tradutor para traduzir a transcrição. Os casos de uso incluem conversa de fala humana para humana traduzida, dublagem ou subtitagem de conteúdo.
- Tradução de texto em imagens: o Azure Visão Computacional, outra Ferramenta Foundry, pode extrair texto visível de imagens. Esse texto extraído pode então ser traduzido. Os casos de uso incluem tradução de documentos digitalizados, menus e sinais.
Considerações ao escolher outros casos de uso
A qualidade da tradução será influenciada pela adequação do conteúdo que está sendo traduzido. O estilo e o registro do texto que está sendo traduzido e a finalidade e o caso de uso determinam a adequação:
Considere usar: conteúdo que é escrito e pontuado corretamente, sendo preciso e fluente. Exemplos desse conteúdo incluem:
- Documentação técnica
- Manuais de produtos
- Bases de dados de conhecimento
- Conteúdo do site
Considere cuidadosamente o uso: tradução de material de autoria não profissional. Os exemplos incluem:
- Escrita coloquial
- Fala transcrita
- Bate-papo nas redes sociais
Considere cuidadosamente a aplicação da revisão humana quando dados confidenciais ou cenários estão envolvidos: é importante incluir um humano no loop para uma revisão manual quando você está lidando com cenários de alto risco (por exemplo, afetando os direitos conseqüentes de alguém) ou dados confidenciais. A tradução automática pode cometer erros. Considere cuidadosamente quando incluir uma etapa de revisão manual para determinados fluxos de trabalho. Por exemplo, traduzir registros médicos deve incluir supervisão humana.
Considere cuidadosamente ao usar para conceder ou negar benefícios: o Tradutor não foi projetado ou avaliado para o prêmio ou negação de benefícios, e o uso nesses cenários pode ter consequências não intencionais. Esses cenários incluem:
- Seguro médico: Isso incluiria o uso de registros de saúde traduzidos e prescrições médicas como base para decisões sobre recompensa ou negação de seguro.
- Aprovações de empréstimos: incluem a tradução de pedidos de novos empréstimos ou refinanciamento dos existentes.
Usos sem suporte:
- Documentos legais: contratos mal traduzidos levam à falha no cumprimento dos contratos.
- Conteúdo criativo, como materiais de marketing, poesia e ficção: a tradução não transmitirá criatividade.
Considerações legais e regulatórias: as organizações precisam avaliar possíveis obrigações legais e regulatórias específicas ao usar quaisquer Ferramentas e soluções do Foundry, que podem não ser apropriadas para uso em todos os setores ou cenários. Além disso, as ferramentas ou soluções do Foundry não são projetadas e podem não ser usadas de maneiras proibidas em termos de serviço aplicáveis e códigos de conduta relevantes.
Limitações
A tradução automática pode ser um método econômico de fornecer traduções de grandes volumes de conteúdo em um tempo muito menor. A tradução automática custa menos de 1/1.000 de tradução humana e é mais rápida, mas pode cometer erros.
Os modelos de tradução automática personalizados normalmente produzem uma saída de qualidade significativamente melhor com um pequeno número de erros de terminologia. Esses modelos de tradução automática são treinados com traduções anteriores grandes e boas o suficiente que são específicas do cliente.
Limitações técnicas, fatores operacionais e intervalos
Contexto completo do documento
Sistemas completos de tradução de documentos estão em desenvolvimento, mas a maioria dos sistemas de tradução automática geralmente disponíveis hoje, incluindo o nosso, processa um documento frase por frase. Quando os sistemas de hoje traduzem uma frase, a maioria deles não tem conhecimento das frases anteriores ou subsequentes no mesmo documento. As informações necessárias para traduzir corretamente uma frase (por exemplo, sexo e número do pronome) só podem estar disponíveis no nível do documento, resultando em uma tradução incorreta.
Exemplo:
- Inglês: o sol estava prestes a se pôr. Ainda estava brilhando brilhantemente.
- Tradução automática para alemão: Die Sonne stand kurz vor dem Untergehen. Ainda estava claro.
O "sol" em alemão tem gênero feminino. A tradução automática neste exemplo usou gênero neutro.
Em traduções de um original sem gênero para uma tradução de gênero, o sistema de tradução pressupõe um gênero. Ele tenta produzir uma frase fluente e gramaticalmente correta no idioma de destino. Quando o sistema usa um gênero, ele aplica um viés em relação ao gênero que era predominante para o contexto determinado no material usado para treinar o sistema. Essa prática pode levar a erros.
Construções sem gênero ocorrem em uma ampla variedade de idiomas, incluindo chinês, finlandês, tâmil, turco e vietnamita.
Sequenciando várias Foundry Tools
Ao sequenciar vários serviços que têm uma taxa de erro diferente de zero, os erros se acumulam. A tradução de reconhecimento de fala ou de OCR (reconhecimento óptico de caracteres) não conseguirá se recuperar de um erro na etapa de reconhecimento inicial e acabará adicionando seus próprios erros após esse processo.
Entrada de idioma misto
Cada solicitação de tradução é convertida de um idioma para outro idioma. Se vários idiomas estiverem no texto de origem de uma única solicitação de tradução, a tradução do texto no idioma de destino poderá ser inferior. Pode ser deixado como está, ser traduzido incorretamente, ser traduzido corretamente ou ser transliterado corretamente ou incorretamente.
O Tradutor pode detectar automaticamente o idioma do texto de origem, mas aplica o idioma detectado ao texto inteiro.
Conhecimento do mundo real
Um sistema de tradução automática é treinado em documentos traduzidos anteriormente. O sistema usa apenas o que pode ser aprendido com as frases individuais dos documentos de treinamento; não tem um contexto mais amplo.
Essa falta de conhecimento do mundo real pode causar vários erros, como:
- As traduções são muito literais, não refletem a implicação, a nuance ou a insinuação do original.
- Expressões idiomáticas e figuras de linguagem que não são literais não expressam o significado implícito do original. Um exemplo em inglês é "Knocking it out of the ballpark" ("Derrubando-o do estádio").
- Quando uma tradução requer uma modificação consciente da cultura do original, isso pode não ser refletido de forma adequada. Esse erro pode ocorrer para uma conversão de moeda, conversão de formato de data ou hora, alteração do nome do idioma quando o idioma oficial de uma região é destinado, ou alteração da região, para localização adequada do documento de destino.
- Títulos e posições de indivíduos potencialmente não são refletidos adequadamente, por exemplo, quando traduzidos de um idioma estrangeiro para a cultura do indivíduo.
- O tom e o humor (irritado, calmo, animado, triste) do original podem não ser refletidos adequadamente. Normalmente, a tradução automática é mais neutra e menos colorida do que a original.
- A idade, o título, o relacionamento ou a experiência de alguém abordado em uma conversa pode não ser refletida adequadamente. Esse erro é especialmente significativo ao traduzir de um idioma onde a maneira de abordar alguém é relativamente independente da idade e da relação, como "você" em inglês, para um idioma onde há várias opções, como "tu" e "vous" em francês. Qual forma de endereço usar é quase sempre relevante. O sistema de tradução escolherá o termo que corresponde melhor aos seus dados de treinamento, com base no contexto curto que ele vê dentro da frase, mas não saberá, por exemplo, se os participantes da conversa estiverem relacionados, mesmo que essas informações sejam mencionadas em outro lugar do documento.
Erros de alta gravidade
Erros de alta gravidade são definidos como erros que podem manchar a reputação da pessoa ou instituição falando em voz traduzida, ou em um texto traduzido ou um documento, seja ele humano ou computador traduzido. Um erro de alta gravidade é embaraçoso para o orador ou autor ou pode levar a uma conclusão errada com consequências significativas. Uma tradução incorreta ou um erro de gramática sozinho não se qualifica como um erro de alta gravidade. A maioria dos erros na tradução automática pode ser corrigida pelo revisor com base no contexto. Um erro de alta gravidade leva a um efeito negativo tangível.
Exemplos de possíveis erros de alta gravidade:
- Negação invertida: o texto original diz para não fazer algo; no entanto, a tradução diz para fazê-lo. Ou o original indica um fato, mas a tradução indica o oposto. Sentenças complexas e negativos duplos podem causar esse erro.
- Número ou unidade de medida alterado: um indicador de dimensão, unidade de medida ou moeda (polegada, libra, centímetro, centavos) é traduzido incorretamente, o que pode levar a uma medida incorreta ou uma perda indevida ou ganho de fundos.
- Nomes e títulos de pessoas falsificados: O título errado é aplicado a uma pessoa, por exemplo, "Rei", onde deveria ser "Príncipe Herdeiro". Em um ambiente politicamente sensível, esse erro pode levar a um constrangimento significativo.
- Figuras religiosas ou símbolos colocados em contexto desfavorável: a ambiguidade no material original pode levar a uma tradução que mostra uma figura religiosa significativa ou um símbolo relevante sob uma luz desfavorável. Pode ser tão simples quanto uma frase com uma conotação religiosa aparecendo como a tradução, ou uma não-palavra, como uma abreviação, um erro de digitação ou uma entrada sem sentido.
- Omissões e conteúdo não fundamentado: a tradução automática pode omitir uma parte do conteúdo de origem ou adicionar um conceito que não estava presente no original. As redes neurais têm a capacidade de produzir frases muito fluentes. Uma frase de origem incomum ou não fluente pode ser traduzida para uma frase de destino que é fluente, mas não reflete o original com precisão ou pode ser completamente não relacionada à origem.
- Ataque: Uma tradução literal de um idioma ou de uma expressão neutra pode se tornar mais agressiva ou ofensiva. Algumas expressões não têm um equivalente cultural na linguagem de destino. Por exemplo, "Break a leg" ("Quebrar uma perna") é um desejo de boa sorte para uma performance de palco. O sistema pode não estar ciente do contexto completo para criar uma tradução adequada.
Com os sistemas de tradução automática de hoje, erros de alta gravidade são raros. O medo de um erro que prejudica a reputação é um grande obstáculo para a publicação de tradução automática bruta e não editada. Embora o risco de erros de alta severidade possa ser baixo para pares de idiomas mais compatíveis, um desenvolvedor desejará usar técnicas para reduzir o efeito se ocorrer. Atualmente, os tradutores humanos estão mais bem equipados para encontrar e corrigir erros de alta gravidade do que os computadores. Adicionar uma etapa de revisão humana para localizar e corrigir erros de alta gravidade na tradução automática é uma maneira de resolver essa limitação. Você também pode considerar a adição de uma revisão humana na solicitação ou com base em métricas de business intelligence, como classificações de usuário, audiência ou a importância do conteúdo, depois de publicar o documento sem revisão.
Desvio
Os sistemas de tradução automática de hoje são criados com base em algoritmos de aprendizado de máquina. Os sistemas de tradução aprendem a traduzir de documentos traduzidos anteriormente. O que o sistema aprendeu é armazenado em um modelo probabilístico, que normalmente é uma rede neural. O runtime que manipula uma solicitação de tradução refere-se a essa rede neural para produzir o que determina ser o melhor candidato entre as traduções possíveis para a entrada fornecida. Essa tradução refletirá o domínio, a terminologia, o estilo e o viés presentes no material de treinamento original. Esse viés pode ser muito sutil. Em alguns pares de idiomas, por exemplo, ao traduzir uma frase sem um pronome de assunto, o sistema compõe um pronome porque a gramática da linguagem de destino requer um assunto. O gênero desse pronome composto será influenciado pelo contexto encontrado no material de treinamento, independentemente do gênero real do assunto no documento que está sendo traduzido. Esse problema é uma área de pesquisa ativa e estamos trabalhando para resolver questões relacionadas a preconceitos.
Exemplos de possíveis preconceitos na tradução automática:
- Viés de gênero: Ao traduzir de uma linguagem neutra em termos de gênero para uma linguagem fortemente de gênero, os pronomes escolhidos serão influenciados pelo contexto encontrado no material de treinamento, que pode não refletir o gênero real do ator.
- Viés político: frases ou escolhas de palavras com um viés político em uma linguagem não necessariamente se traduzem com o mesmo viés ou conotação na outra linguagem.
- Viés religioso: como o viés político, a escolha das palavras pode indicar um ponto de vista específico, uma certa crença ou um dogma. Ao alternar idiomas, esse ponto de vista pode ser adicionado ou removido ou alterado para uma interpretação diferente.
- Orientação sexual, origem nacional, etnia, raça: Os termos que a sociedade aplica aos grupos dentro dessa sociedade mudam ao longo do tempo. Um termo discriminatório escrito em um documento original pode ter persistido no material de treinamento e pode aparecer na tradução em um contexto prejudicial.
- Profanidade: O que é considerado profano dentro de uma cultura muda ao longo do tempo. A intenção do sistema de tradução é manter a natureza profana ou não profane da expressão na entrada. Esse nível de precisão não funciona com 100% de confiabilidade porque muitos termos profanos são de fato ambíguos, e o grau de profanidade do termo traduzido varia entre as linguagens envolvidas.
Desempenho do sistema
- A API de Tradutor não tem limites para solicitações simultâneas.
- A API do Tradutor define várias cotas na contagem de caracteres que podem ser traduzidos em uma hora por um recurso de tradutor com base na SKU licenciada pelo cliente. Os limites de cota variam de 40 milhões de caracteres por hora a 200 milhões de caracteres por hora.
- O Tradutor tem uma latência máxima de 15 segundos usando modelos padrão. Normalmente, as respostas de texto dentro de 100 caracteres são retornadas em 150 milissegundos a 300 milissegundos.
- Os tempos de resposta da API do Tradutor variam de acordo com o tamanho da solicitação e do par de idiomas.
- A tradução entre um idioma e um inglês é mais rápida do que a tradução entre dois idiomas que não sejam inglês.
Melhores práticas para melhorar o desempenho do sistema
- Os usuários podem obter o melhor desempenho na tradução de uma frase de texto em vários idiomas de destino, fazendo solicitações individuais para cada idioma em vez de fazer uma única solicitação para vários idiomas. Essa abordagem ajuda os usuários a consumir traduções disponíveis em vez de esperar que todas as traduções retornem pelo sistema.
- Se o volume de tradução for alto, alterne para níveis de volume ou compromisso mais altos.
Avaliação do Tradutor
Métodos de avaliação
A qualidade da tradução é sempre relativa a um conjunto de testes. Não há conjuntos de testes de tradução padrão estabelecidos para o benchmarking. Por esse motivo, não publicamos as pontuações absolutas de nossas próprias medidas dos sistemas de tradução automática.
Os sistemas de tradução automática baseados em rede neural de hoje podem produzir frases fluentes e gramaticalmente corretas, dada uma origem adequada. No entanto, a qualidade dos sistemas de tradução automática difere por par de idiomas. Podemos determinar se uma determinada classe de documentos é adequada para tradução automática para um par de idiomas específico.
Recomendamos que você meça a qualidade de um conjunto de testes representativo para um determinado cenário. O nível de tolerância de tradução incorreta por idioma varia de acordo com o cenário. A expectativa de tradução linguística, formal e coloquial também varia de acordo com o cenário.
Resultados de avaliação
Há muitas maneiras de medir a qualidade. As técnicas automáticas calculam a distância para uma tradução de referência criada por humanos. A pontuação BLEU (Bilingual Evaluation Understudy) é a técnica mais antiga e ainda é popular. Outras técnicas empregam um modelo de linguagem treinado para medir a distância para sequências e o contexto armazenado no modelo, como a métrica otimizada entre linguagens para avaliação de conversão (COMET). Em uma avaliação humana, os avaliadores avaliam a tradução em um ou mais critérios, por exemplo, precisão e fluência. Medimos continuamente a qualidade do Tradutor usando uma infinidade de técnicas. A avaliação humana fornece as pontuações mais significativas e confiáveis.
Avaliando e integrando o Tradutor para seu uso
À medida que a Microsoft trabalha para ajudar os clientes a desenvolver e implantar soluções com segurança usando o Tradutor, estamos adotando uma abordagem de princípios para defender a agência pessoal e a dignidade, considerando a imparcialidade, confiabilidade e segurança dos sistemas de IA, privacidade e segurança, inclusão, transparência e responsabilidade humana dos sistemas de IA. Essas considerações estão em linha com nosso compromisso de desenvolver IA responsável.
Quando estiver se preparando para integrar e usar produtos ou recursos alimentados por IA, tenha em mente os seguintes princípios:
- Recomendações de pré-desenvolvimento do aplicativo: recomendamos que os desenvolvedores comecem realizando uma avaliação de impacto para entender o uso, o contexto e os usos não intencionais ou de alto risco pretendidos para evitar.
- Entenda o que ele pode fazer: avalie totalmente o Tradutor para entender seus recursos e/ou limitações. O teste da Microsoft pode não refletir seu cenário. Entenda como ele será executado em seu cenário específico testando-o minuciosamente com condições reais e dados diversos do usuário que refletem seu contexto, incluindo considerações de imparcialidade.
Humanos no loop: inclua a supervisão humana como uma área de padrão consistente a ser explorada. Essa abordagem significa garantir a supervisão humana constante do Tradutor e manter o papel dos humanos na tomada de decisões. Verifique se você pode ter uma intervenção humana em tempo real na solução para evitar danos. Essa funcionalidade permite que você gerencie onde o Tradutor não é executado conforme necessário.
- Medidas de qualidade: recomendamos medir a qualidade da tradução para um conjunto de testes representativo para um determinado cenário. O nível de tolerância de tradução incorreta por idioma varia de acordo com o cenário. A expectativa de tradução linguística, formal e coloquial também varia de acordo com o cenário. Para obter mais informações, consulte a secção seguinte.
- Respeitar o direito de privacidade de um indivíduo: o Tradutor não retém o conteúdo que os clientes enviam para tradução. É recomendável não reter o conteúdo e as informações recebidas dos usuários do aplicativo para respeitar o direito de privacidade dos indivíduos.
- Revisão legal: obtenha conselhos legais apropriados para revisar sua solução, especialmente se você planeja usá-la em aplicativos confidenciais ou de alto risco. Entenda quais restrições você pode precisar para trabalhar e sua responsabilidade para resolver quaisquer problemas futuros.
- Segurança: verifique se sua solução é segura e tem controles adequados para preservar a integridade do conteúdo e impedir o acesso não autorizado.
- Loop de comentários do cliente: forneça um canal de comentários que permita que usuários e indivíduos relatem problemas com o serviço depois que ele for implantado. Depois de implantar o Tradutor, ele requer monitoramento e melhoria contínuos. Esteja pronto para implementar comentários e sugestões de melhoria.
Humanos no loop
Uma introdução responsável da tradução automática inclui a opção de conduzir uma revisão humana e corrigir a tradução automática.
Os revisores humanos têm conhecimento do mundo real, experiência no assunto e sensibilidade natural para palavras e frases potencialmente controversas. Os humanos podem identificar o contexto relevante e produzir uma tradução que reflita o tom apropriado para determinada situação. Os computadores são mais limitados em sua capacidade de aplicar tom e contexto corretamente.
É benéfico se preparar para a infraestrutura que pode executar uma revisão humana de forma rápida e eficiente. Esse tipo de sistema é chamado de TMS (sistema de gerenciamento de tradução). Os TMSs estão disponíveis em muitos fornecedores. A Microsoft não comercializa um TMS. O Tradutor é integrado a vários TMSs.
A revisão humana é uma atividade cara. Para uso ideal de fundos e disponibilidade imediata de documentos para um público-alvo, você deve identificar indicadores com base no uso pretendido ou no business intelligence. Esses indicadores podem sugerir que o artigo ou elemento de um documento precisa de uma revisão humana.
Exemplos de sinais de business intelligence:
- Visualizações de página: o editor de informações traduzidas decide sobre um limite determinado pelas visualizações de página das informações traduzidas. Se as informações traduzidas pelo computador passarem pelo limite de exibição de página definido, o sistema disparará uma revisão humana desse conteúdo. A revisão humana pode reduzir a exposição de uma tradução incorreta para visualizadores ou clientes adicionais.
- Escalonamento de usuário: o destinatário da tradução pode fornecer comentários ou emitir um alerta sobre uma tradução incorreta, enganosa ou ofensiva. Esse escalonamento dispara uma revisão humana do conteúdo em questão.
- Escalonamento de funcionários: um funcionário do editor de informações traduzidas pode emitir uma solicitação para revisão humana de um artigo.
- Importância ou valor do item: um artigo sobre ou uma descrição de um item de baixo preço e baixo volume para venda pode não ser economicamente viável para ser traduzido por um humano. No entanto, um item de valor mais alto pode justificar bem a despesa de uma tradução humana. O valor alto pode disparar automaticamente uma revisão humana da tradução.
- Adequação: algumas classes de documentos se traduzem com melhor qualidade do que outras. Um editor pode usar mecanismos de pontuação automática ou classificação do conteúdo do documento para determinar se este documento precisa de uma revisão humana. O Microsoft Azure oferece algumas técnicas de classificação baseada em conteúdo, como Reconhecimento Vocal e Análise de Texto. O Tradutor não retorna uma pontuação de confiança para suas traduções.