Evaluación del módulo

1.

¿Qué actividad ocurre durante la fase de preprocesamiento del reconocimiento de voz?

El audio se convierte en formato .wmv.

El ruido de fondo se agrega a la señal de audio.

Los vectores de características se extraen de la forma de onda de audio para el modelado.

2.

¿Qué son los phonemes?

Artefactos que se eliminan de la señal como parte del proceso de limpieza.

La unidad más pequeña de sonido en voz.

Modelos de IA que generan audio.

3.

¿Por qué es importante generar prosodia en la síntesis de voz?

Prosody maximiza el volumen de la salida de audio.

Prosody traduce el discurso al idioma del oyente.

Prosody garantiza la pronunciación natural y la cadencia de voz.

Comprueba tus conocimientos