Wprowadzenie

1 minuta

Mowa jest jednym z najbardziej naturalnych sposobów komunikowania się ludzi i zapewniania możliwości mowy aplikacjom sztucznej inteligencji tworzy bardziej intuicyjne, dostępne i angażujące środowiska użytkownika. Niezależnie od tego, czy tworzysz asystenta głosowego, tworzysz dostępne aplikacje, czy opracowujesz agentów konwersacyjnej sztucznej inteligencji, zrozumienie technologii mowy jest niezbędne dla nowoczesnych rozwiązań sztucznej inteligencji.

W tym module zapoznasz się z dwiema podstawowymi funkcjami rozpoznawania mowy, które umożliwiają korzystanie z głosu w aplikacjach: rozpoznawanie mowy (konwertowanie wyrazów mówionych na tekst) i syntezę mowy (konwertowanie tekstu na naturalnie brzmiącą mowę). Dowiesz się, jak te technologie współpracują ze sobą, aby tworzyć bezproblemowe interakcje głosowe i dowiedzieć się więcej o rzeczywistych scenariuszach, w których mowa może przekształcać środowiska użytkownika.

Uwaga / Notatka

Zdajemy sobie sprawę, że różni ludzie lubią uczyć się na różne sposoby. Możesz ukończyć ten moduł w formacie wideo lub przeczytać zawartość jako tekst i obrazy. Tekst zawiera więcej szczegółów niż filmy wideo, więc w niektórych przypadkach możesz chcieć odwoływać się do niego jako materiał uzupełniający do prezentacji wideo.

Sprzężenie zwrotne

Czy ta strona była pomocna?