Voz

Concluído

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

As capacidades de fala em aplicações e agentes de IA permitem que os utilizadores interajam com elas através da linguagem falada.

Reconhecimento de fala

Diagrama da entrada falada de um utilizador a ser convertida em texto.

O reconhecimento de fala é a capacidade da IA de "ouvir" e interpretar a fala. Normalmente, esta capacidade assume a forma de fala para texto (onde o sinal de áudio para a fala é transcrito em texto).

Síntese de fala

Diagrama do texto a ser convertido em fala audível.

A síntese de fala é a capacidade da IA de vocalizar palavras como linguagem falada. Normalmente, esta capacidade assume a forma de conversão de texto em fala, na qual a informação em formato de texto é convertida num sinal audível.

A tecnologia de fala de IA está evoluindo rapidamente para lidar com desafios como ignorar o ruído de fundo, detetar interrupções e gerar vozes cada vez mais expressivas e semelhantes às humanas.

Cenários de fala de IA

Os usos comuns das tecnologias de fala de IA incluem:

  • Agentes de IA que compreendem a entrada oral, executam tarefas e respondem com resultados falados.
  • Transcrição automática de chamadas ou reuniões.
  • Automatização de descrições de áudio de vídeo ou texto.
  • Tradução automática de fala entre idiomas.