Wprowadzenie

2 min

Usługa Azure Speech udostępnia interfejsy API, których można użyć do tworzenia aplikacji z obsługą mowy. Obejmuje to:

Zamiana mowy na tekst: interfejs API, który umożliwia rozpoznawanie mowy , w którym aplikacja może akceptować wypowiedziane dane wejściowe.
Zamiana tekstu na mowę: interfejs API, który umożliwia syntezę mowy , w której aplikacja może udostępniać mówione dane wyjściowe.
Tłumaczenie mowy: interfejs API, którego można użyć do tłumaczenia mówionych danych wejściowych na wiele języków.
Rozpoznawanie słów kluczowych: interfejs API, który umożliwia aplikacji rozpoznawanie słów kluczowych lub krótkich fraz.
Rozpoznawanie intencji: interfejs API, który używa interpretacji języka konwersacyjnego do określania semantycznego znaczenia wypowiedzianych danych wejściowych.

Ten moduł koncentruje się na rozpoznawaniu mowy i syntezie mowy, które są podstawowymi możliwościami dowolnej aplikacji obsługującej mowę.

Uwaga / Notatka

Przykłady kodu w tym module znajdują się w języku Python, ale można użyć dowolnego z dostępnych pakietów zestawu SDK usługi Azure Speech do tworzenia aplikacji z obsługą mowy w preferowanym języku. Dostępne pakiety zestawu SDK obejmują:

Sprzężenie zwrotne

Czy ta strona była pomocna?