Ocena modułu

1.

Jakie działanie ma miejsce podczas etapu przetwarzania wstępnego rozpoznawania mowy?

Dźwięk jest konwertowany na format .wmv.

Szum tła jest dodawany do sygnału dźwiękowego.

Wektory funkcji są wyodrębniane z kształtów fal dźwiękowych do modelowania.

2.

Co to są telefony?

Artefakty usuwane z sygnału w ramach procesu czyszczenia.

Najmniejsza jednostka dźwięku w mowie.

Modele sztucznej inteligencji generujące dźwięk.

3.

Dlaczego ważne jest generowanie prosodii w syntezie mowy?

Prosody maksymalizuje głośność wyjściową.

Prosody tłumaczy mowę na język odbiornika.

Prosodia zapewnia naturalną wymowę i rytm mowy.

Sprawdź swoją wiedzę