Introdução
A fala é uma das maneiras mais naturais pelas quais os humanos se comunicam e trazer recursos de fala para aplicativos de IA cria experiências de usuário mais intuitivas, acessíveis e envolventes. Se você estiver criando um assistente de voz, criando aplicativos acessíveis ou desenvolvendo agentes de IA de conversa, entender as tecnologias de fala é essencial para soluções modernas de IA.
Neste módulo, você explorará as duas funcionalidades fundamentais de fala que alimentam aplicativos habilitados para voz: reconhecimento de fala (conversão de palavras faladas em texto) e síntese de fala (convertendo texto em fala natural). Você descobrirá como essas tecnologias funcionam juntas para criar interações de voz perfeitas e aprender sobre os cenários do mundo real em que a fala pode transformar experiências do usuário.
Observação
Reconhecemos que pessoas diferentes gostam de aprender de maneiras diferentes. Você pode optar por concluir este módulo em formato baseado em vídeo ou ler o conteúdo como texto e imagens. O texto contém mais detalhes do que os vídeos, portanto, em alguns casos, talvez você queira se referir a ele como material complementar à apresentação de vídeo.