Ta przeglądarka nie jest już obsługiwana.
Zaktualizuj do Microsoft Edge, aby skorzystać z najnowszych funkcji, aktualizacji bezpieczeństwa i wsparcia technicznego.
Jakie działanie ma miejsce podczas etapu przetwarzania wstępnego rozpoznawania mowy?
Dźwięk jest konwertowany na format .wmv.
Szum tła jest dodawany do sygnału dźwiękowego.
Wektory funkcji są wyodrębniane z kształtów fal dźwiękowych do modelowania.
Co to są telefony?
Artefakty usuwane z sygnału w ramach procesu czyszczenia.
Najmniejsza jednostka dźwięku w mowie.
Modele sztucznej inteligencji generujące dźwięk.
Dlaczego ważne jest generowanie prosodii w syntezie mowy?
Prosody maksymalizuje głośność wyjściową.
Prosody tłumaczy mowę na język odbiornika.
Prosodia zapewnia naturalną wymowę i rytm mowy.
Przed sprawdzeniem pracy musisz odpowiedzieć na wszystkie pytania.
Czy ta strona była pomocna?
Potrzebujesz pomocy w tym temacie?
Chcesz spróbować użyć Ask Learn, aby wyjaśnić lub poprowadzić się przez ten temat?