Zamiana tekstu na mowę na platformę Azure
Zamiana tekstu na mowę platformy Azure umożliwia tworzenie aplikacji i usług, które naturalnie mówią z ponad 400 głosami w 140 językach i dialektach.
Ten łącznik jest dostępny w następujących produktach i regionach:
| Usługa | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Wszystkie regiony usługi Power Automate z wyjątkiem następujących: - China Cloud obsługiwane przez firmę 21Vianet |
| Logic Apps | Standard | Wszystkie regiony usługi Logic Apps z wyjątkiem następujących: — Regiony platformy Azure (Chiny) |
| Power Apps | Premium | Wszystkie regiony usługi Power Apps z wyjątkiem następujących: - China Cloud obsługiwane przez firmę 21Vianet |
| Power Automate | Premium | Wszystkie regiony usługi Power Automate z wyjątkiem następujących: - China Cloud obsługiwane przez firmę 21Vianet |
| Kontakt | |
|---|---|
| Name | Zespół ds. platformy Power Platform usługi Mowa |
| adres URL | https://docs.microsoft.com/azure/cognitive-services/speech-service/support |
| speechpowerplatform@microsoft.com |
| Metadane łącznika | |
|---|---|
| Publisher | Microsoft |
| Witryna internetowa | https://docs.microsoft.com/azure/cognitive-services/speech-service/ |
| Zasady ochrony prywatności | https://privacy.microsoft.com |
| Kategorie | AI; Witryna internetowa |
Usługa mowa umożliwia konwertowanie tekstu na syntetyzowany mowę i uzyskiwanie listy obsługiwanych głosów dla regionu przy użyciu interfejsu API REST.
Pre-requisites
Aby kontynuować, musisz wykonać następujące czynności:
- Subskrypcja platformy Azure — utwórz jedną bezpłatnie.
- Utwórz zasób usługi Mowa w witrynie Azure Portal.
- Pobierz klucz zasobu usługi Mowa i region. Po wdrożeniu zasobu usługi Mowa wybierz pozycję Przejdź do zasobu , aby wyświetlić klucze i zarządzać nimi. Aby uzyskać więcej informacji na temat zasobów usług Cognitive Services, zobacz Pobieranie kluczy dla zasobu.
- Dowiedz się więcej na temat ustawień regionalnych i głosów obsługiwanych przez zamianę tekstu na mowę platformy Azure.
Tworzenie połączenia
Łącznik obsługuje następujące typy uwierzytelniania:
| Klucz interfejsu API | ApiKey | Wszystkie regiony | Udostępnialne |
| Microsoft Entra ID Integrated | Użyj identyfikatora Entra firmy Microsoft, aby uzyskać dostęp do usługi rozpoznawania mowy. | Wszystkie regiony z wyjątkiem platformy Azure Government i Departamentu Obrony (DoD) w usługach Azure Government i US Government (GCC-High) | Nie można udostępniać |
| Microsoft Entra ID Integrated (Azure Government) | Użyj identyfikatora Entra firmy Microsoft, aby uzyskać dostęp do usługi rozpoznawania mowy. | Platforma Azure Government i Departament Obrony (DoD) tylko w usługach Azure Government i US Government (GCC-High) | Nie można udostępniać |
| Domyślne [PRZESTARZAŁE] | Ta opcja dotyczy tylko starszych połączeń bez jawnego typu uwierzytelniania i jest dostępna tylko w celu zapewnienia zgodności z poprzednimi wersjami. | Wszystkie regiony | Nie można udostępniać |
Klucz interfejsu API
Identyfikator uwierzytelniania: keyBasedAuth
Dotyczy: wszystkie regiony
ApiKey
Jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power jest udostępniana innemu użytkownikowi, połączenie jest również udostępniane. Aby uzyskać więcej informacji, zobacz Omówienie łączników dla aplikacji kanwy — Power Apps | Microsoft Docs
| Name | Typ | Description | Wymagane |
|---|---|---|---|
| Klucz konta | securestring | Klucz usługi rozpoznawania mowy | Prawda |
| Region | ciąg | Region usługi Mowa (przykład: eastus) | Prawda |
Microsoft Entra ID Zintegrowany
Identyfikator uwierzytelniania: tokenBasedAuth
Dotyczy: wszystkie regiony z wyjątkiem platformy Azure Government i Departamentu Obrony (DoD) w usługach Azure Government i US Government (GCC-High)
Użyj identyfikatora Entra firmy Microsoft, aby uzyskać dostęp do usługi rozpoznawania mowy.
Nie jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power zostanie udostępniona innemu użytkownikowi, zostanie wyświetlony monit o jawne utworzenie nowego połączenia.
| Name | Typ | Description | Wymagane |
|---|---|---|---|
| Identyfikator zasobu | ciąg | Identyfikator zasobu usług Cognitive Services (przykład: /subscriptions/<Subscription ID>/resourceGroups/<ResourceGroups>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Nazwa> zasobu) | Prawda |
| Poddomena niestandardowa | ciąg | Adres URL niestandardowej poddomeny punktu końcowego (przykład: contoso) | Prawda |
Microsoft Entra ID Integrated (Azure Government)
Identyfikator uwierzytelniania: tokenBasedAuth
Dotyczy: tylko platforma Azure Government i Departament Obrony (DoD) w usługach Azure Government i US Government (GCC-High)
Użyj identyfikatora Entra firmy Microsoft, aby uzyskać dostęp do usługi rozpoznawania mowy.
Nie jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power zostanie udostępniona innemu użytkownikowi, zostanie wyświetlony monit o jawne utworzenie nowego połączenia.
| Name | Typ | Description | Wymagane |
|---|---|---|---|
| Identyfikator zasobu | ciąg | Identyfikator zasobu usług Cognitive Services (przykład: /subscriptions/<Subscription ID>/resourceGroups/<ResourceGroups>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Nazwa> zasobu) | Prawda |
| Poddomena niestandardowa | ciąg | Adres URL niestandardowej poddomeny punktu końcowego (przykład: contoso) | Prawda |
Domyślne [PRZESTARZAŁE]
Dotyczy: wszystkie regiony
Ta opcja dotyczy tylko starszych połączeń bez jawnego typu uwierzytelniania i jest dostępna tylko w celu zapewnienia zgodności z poprzednimi wersjami.
Nie jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power zostanie udostępniona innemu użytkownikowi, zostanie wyświetlony monit o jawne utworzenie nowego połączenia.
| Name | Typ | Description | Wymagane |
|---|---|---|---|
| Klucz konta | securestring | Usługa Azure Cognitive Services dla klucza konta neuronowego zamiany tekstu na mowę | Prawda |
| Region | ciąg | Region usługi Mowa (przykład: eastus) | Prawda |
Limity ograniczania
| Nazwa | Wywołania | Okres odnowienia |
|---|---|---|
| Wywołania interfejsu API na połączenie | 100 | 60 sekund |
Akcje
| Konwertowanie tekstu na mowę |
Konwertowanie pojedynczego tekstu na mowę. |
| Konwertowanie tekstu na mowę przy użyciu języka SSML |
Konwertowanie tekstu na mowę przy użyciu języka znaczników syntezy mowy (SSML) |
| Pobieranie listy głosów |
Uzyskaj pełną listę głosów dla określonego regionu lub punktu końcowego. |
Konwertowanie tekstu na mowę
Konwertowanie pojedynczego tekstu na mowę.
Parametry
| Nazwa | Klucz | Wymagane | Typ | Opis |
|---|---|---|---|---|
|
Nazwa głosu
|
voiceName | True | string |
Dane wyjściowe nazwy głosu dla tekstu na mowę. Na przykład: en-US-JennyNeural. |
|
Lokalizacja
|
locale | True | string |
Ustawienia regionalne zawartych danych. Na przykład: en-US. |
|
Syntetyzowany tekst
|
synthesizedText | True | string |
Syntetyzowany tekst, który należy przekonwertować na mowę. |
|
Format dźwięku wyjściowego
|
outputFormat | string |
Formaty audio bez przesyłania strumieniowego. Ustawienie domyślne: riff-24khz-16bit-mono-pcm. |
|
|
Styl
|
style | string |
Ekspresowy styl mowy. Na przykład: wesoły. |
|
|
Wskaźnik mówienia
|
speakingRate | string |
Szybkość mowy. Na przykład: -40.00%. |
Konwertowanie tekstu na mowę przy użyciu języka SSML
Konwertowanie tekstu na mowę przy użyciu języka znaczników syntezy mowy (SSML)
Parametry
| Nazwa | Klucz | Wymagane | Typ | Opis |
|---|---|---|---|---|
|
Tekst SSML
|
ssmlText | True | string |
Tekst w formacie SSML (np. <speak xmlns='http://www.w3.org/2001/10/synthesis' xmlns:mstts='http://www.w3.org/2001/mstts' xmlns:emo='http://www.w3.org/2009/10/emotionml' version='1.0' xml:lang='en-US'><voice name='en-US-ChristopherNeural'power> connector</voice></speak>) |
|
Format dźwięku wyjściowego
|
outputFormat | string |
Formaty audio bez przesyłania strumieniowego. Ustawienie domyślne: riff-24khz-16bit-mono-pcm. |
Pobieranie listy głosów
Uzyskaj pełną listę głosów dla określonego regionu lub punktu końcowego.
Zwraca
| Nazwa | Ścieżka | Typ | Opis |
|---|---|---|---|
|
|
array of object | ||
|
items
|
object |
macierz |