Este explorador ya no se admite.
Actualice a Microsoft Edge para aprovechar las características y actualizaciones de seguridad más recientes, y disponer de soporte técnico.
¿Qué actividad ocurre durante la fase de preprocesamiento del reconocimiento de voz?
El audio se convierte en formato .wmv.
El ruido de fondo se agrega a la señal de audio.
Los vectores de características se extraen de la forma de onda de audio para el modelado.
¿Qué son los phonemes?
Artefactos que se eliminan de la señal como parte del proceso de limpieza.
La unidad más pequeña de sonido en voz.
Modelos de IA que generan audio.
¿Por qué es importante generar prosodia en la síntesis de voz?
Prosody maximiza el volumen de la salida de audio.
Prosody traduce el discurso al idioma del oyente.
Prosody garantiza la pronunciación natural y la cadencia de voz.
Debe responder todas las preguntas antes de comprobar su trabajo.
¿Le ha resultado útil esta página?
¿Necesita ayuda con este tema?
¿Desea intentar usar Ask Learn para aclarar o guiarle a través de este tema?