Introducción

Completado

La voz es una de las formas más naturales en las que los humanos se comunican y la incorporación de funcionalidades de voz a las aplicaciones de inteligencia artificial crea experiencias de usuario más intuitivas, accesibles y atractivas. Tanto si va a crear un asistente de voz, crear aplicaciones accesibles o desarrollar agentes de inteligencia artificial conversacional, comprender las tecnologías de voz es esencial para las soluciones modernas de inteligencia artificial.

En este módulo, explorará las dos funcionalidades fundamentales de voz que potencian las aplicaciones habilitadas para voz: reconocimiento de voz (conversión de palabras habladas en texto) y síntesis de voz (conversión de texto a voz de sonido natural). Descubrirá cómo funcionan conjuntamente estas tecnologías para crear interacciones de voz sin problemas y conocer los escenarios reales en los que la voz puede transformar las experiencias del usuario.

Nota:

Reconocemos que a diferentes personas les gusta aprender de diferentes maneras. Puede optar por completar este módulo en formato basado en vídeo o puede leer el contenido como texto e imágenes. El texto contiene más detalle que los vídeos, por lo que, en algunos casos, es posible que desee hacer referencia a él como material complementario para la presentación de vídeo.