Introdução

Concluído

Os recursos de fala de IA nos permitem gerenciar sistemas domésticos e automáticos com instruções de voz, obter respostas de computadores para perguntas faladas, gerar legendas a partir de áudio e muito mais.

Para permitir esse tipo de interação, o sistema de IA deve suportar pelo menos dois recursos:

  • Reconhecimento de fala - a capacidade de detetar e interpretar a entrada falada
  • Síntese de fala - a capacidade de gerar saída falada

O Azure Speech oferece capacidades de voz para texto, texto para voz e tradução de voz através do reconhecimento e síntese de voz. Você pode usar modelos de serviço de fala pré-criados e personalizados para uma variedade de tarefas, desde transcrever áudio para texto com alta precisão, até identificar alto-falantes em conversas, criar vozes personalizadas e muito mais. Em seguida, você aprenderá como os recursos de fala de IA funcionam.