Voz
Observação
Consulte a guia Texto e imagens para obter mais detalhes!
As capacidades de fala em aplicações e agentes de IA permitem que os utilizadores interajam com elas através da linguagem falada.
Reconhecimento de fala
O reconhecimento de fala é a capacidade da IA de "ouvir" e interpretar a fala. Normalmente, esta capacidade assume a forma de fala para texto (onde o sinal de áudio para a fala é transcrito em texto).
Síntese de fala
A síntese de fala é a capacidade da IA de vocalizar palavras como linguagem falada. Normalmente, esta capacidade assume a forma de conversão de texto em fala, na qual a informação em formato de texto é convertida num sinal audível.
A tecnologia de fala de IA está evoluindo rapidamente para lidar com desafios como ignorar o ruído de fundo, detetar interrupções e gerar vozes cada vez mais expressivas e semelhantes às humanas.
Cenários de fala de IA
Os usos comuns das tecnologias de fala de IA incluem:
- Agentes de IA que compreendem a entrada oral, executam tarefas e respondem com resultados falados.
- Transcrição automática de chamadas ou reuniões.
- Automatização de descrições de áudio de vídeo ou texto.
- Tradução automática de fala entre idiomas.