Mowa
Uwaga / Notatka
Aby uzyskać więcej szczegółów, zobacz kartę Tekst i obrazy .
Funkcje mowy w aplikacjach sztucznej inteligencji i agentach umożliwiają użytkownikom interakcję z nimi za pośrednictwem języka mówionego.
Rozpoznawanie mowy
Rozpoznawanie mowy to zdolność sztucznej inteligencji do "słuchania" i interpretowania mowy. Zazwyczaj ta funkcja przyjmuje formę zamiany mowy na tekst (gdzie sygnał dźwiękowy mowy jest transkrybowany na tekst).
Synteza mowy
Synteza mowy to zdolność sztucznej inteligencji do wokalizacji słów jako języka mówionego. Zazwyczaj ta funkcja ma postać zamiany tekstu na mowę , w której informacje w formacie tekstowym są konwertowane na sygnał słyszalny.
Technologia mowy sztucznej inteligencji szybko rozwija się, aby sprostać wyzwaniom, takie jak ignorowanie szumu w tle, wykrywanie przerw i generowanie coraz bardziej wyrazistych i ludzkich głosów.
Scenariusze mowy sztucznej inteligencji
Typowe zastosowania technologii mowy sztucznej inteligencji obejmują:
- Agenci sztucznej inteligencji, którzy rozumieją mówione dane wejściowe, wykonują zadania i reagują na wypowiedziane wyniki.
- Automatyczna transkrypcja połączeń lub spotkań.
- Automatyzowanie opisów audio wideo lub tekstu.
- Automatyczne tłumaczenie mowy między językami.