Udostępnij przez


Zamiana tekstu na mowę na platformę Azure

Zamiana tekstu na mowę platformy Azure umożliwia tworzenie aplikacji i usług, które naturalnie mówią z ponad 400 głosami w 140 językach i dialektach.

Ten łącznik jest dostępny w następujących produktach i regionach:

Usługa Class Regions
Copilot Studio Premium Wszystkie regiony usługi Power Automate z wyjątkiem następujących:
     - China Cloud obsługiwane przez firmę 21Vianet
Logic Apps Standard Wszystkie regiony usługi Logic Apps z wyjątkiem następujących:
     — Regiony platformy Azure (Chiny)
Power Apps Premium Wszystkie regiony usługi Power Apps z wyjątkiem następujących:
     - China Cloud obsługiwane przez firmę 21Vianet
Power Automate Premium Wszystkie regiony usługi Power Automate z wyjątkiem następujących:
     - China Cloud obsługiwane przez firmę 21Vianet
Kontakt
Name Zespół ds. platformy Power Platform usługi Mowa
adres URL https://docs.microsoft.com/azure/cognitive-services/speech-service/support
Email speechpowerplatform@microsoft.com
Metadane łącznika
Publisher Microsoft
Witryna internetowa https://docs.microsoft.com/azure/cognitive-services/speech-service/
Zasady ochrony prywatności https://privacy.microsoft.com
Kategorie AI; Witryna internetowa

Usługa mowa umożliwia konwertowanie tekstu na syntetyzowany mowę i uzyskiwanie listy obsługiwanych głosów dla regionu przy użyciu interfejsu API REST.

Pre-requisites

Aby kontynuować, musisz wykonać następujące czynności:

Tworzenie połączenia

Łącznik obsługuje następujące typy uwierzytelniania:

Klucz interfejsu API ApiKey Wszystkie regiony Udostępnialne
Microsoft Entra ID Integrated Użyj identyfikatora Entra firmy Microsoft, aby uzyskać dostęp do usługi rozpoznawania mowy. Wszystkie regiony z wyjątkiem platformy Azure Government i Departamentu Obrony (DoD) w usługach Azure Government i US Government (GCC-High) Nie można udostępniać
Microsoft Entra ID Integrated (Azure Government) Użyj identyfikatora Entra firmy Microsoft, aby uzyskać dostęp do usługi rozpoznawania mowy. Platforma Azure Government i Departament Obrony (DoD) tylko w usługach Azure Government i US Government (GCC-High) Nie można udostępniać
Domyślne [PRZESTARZAŁE] Ta opcja dotyczy tylko starszych połączeń bez jawnego typu uwierzytelniania i jest dostępna tylko w celu zapewnienia zgodności z poprzednimi wersjami. Wszystkie regiony Nie można udostępniać

Klucz interfejsu API

Identyfikator uwierzytelniania: keyBasedAuth

Dotyczy: wszystkie regiony

ApiKey

Jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power jest udostępniana innemu użytkownikowi, połączenie jest również udostępniane. Aby uzyskać więcej informacji, zobacz Omówienie łączników dla aplikacji kanwy — Power Apps | Microsoft Docs

Name Typ Description Wymagane
Klucz konta securestring Klucz usługi rozpoznawania mowy Prawda
Region ciąg Region usługi Mowa (przykład: eastus) Prawda

Microsoft Entra ID Zintegrowany

Identyfikator uwierzytelniania: tokenBasedAuth

Dotyczy: wszystkie regiony z wyjątkiem platformy Azure Government i Departamentu Obrony (DoD) w usługach Azure Government i US Government (GCC-High)

Użyj identyfikatora Entra firmy Microsoft, aby uzyskać dostęp do usługi rozpoznawania mowy.

Nie jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power zostanie udostępniona innemu użytkownikowi, zostanie wyświetlony monit o jawne utworzenie nowego połączenia.

Name Typ Description Wymagane
Identyfikator zasobu ciąg Identyfikator zasobu usług Cognitive Services (przykład: /subscriptions/<Subscription ID>/resourceGroups/<ResourceGroups>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Nazwa> zasobu) Prawda
Poddomena niestandardowa ciąg Adres URL niestandardowej poddomeny punktu końcowego (przykład: contoso) Prawda

Microsoft Entra ID Integrated (Azure Government)

Identyfikator uwierzytelniania: tokenBasedAuth

Dotyczy: tylko platforma Azure Government i Departament Obrony (DoD) w usługach Azure Government i US Government (GCC-High)

Użyj identyfikatora Entra firmy Microsoft, aby uzyskać dostęp do usługi rozpoznawania mowy.

Nie jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power zostanie udostępniona innemu użytkownikowi, zostanie wyświetlony monit o jawne utworzenie nowego połączenia.

Name Typ Description Wymagane
Identyfikator zasobu ciąg Identyfikator zasobu usług Cognitive Services (przykład: /subscriptions/<Subscription ID>/resourceGroups/<ResourceGroups>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Nazwa> zasobu) Prawda
Poddomena niestandardowa ciąg Adres URL niestandardowej poddomeny punktu końcowego (przykład: contoso) Prawda

Domyślne [PRZESTARZAŁE]

Dotyczy: wszystkie regiony

Ta opcja dotyczy tylko starszych połączeń bez jawnego typu uwierzytelniania i jest dostępna tylko w celu zapewnienia zgodności z poprzednimi wersjami.

Nie jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power zostanie udostępniona innemu użytkownikowi, zostanie wyświetlony monit o jawne utworzenie nowego połączenia.

Name Typ Description Wymagane
Klucz konta securestring Usługa Azure Cognitive Services dla klucza konta neuronowego zamiany tekstu na mowę Prawda
Region ciąg Region usługi Mowa (przykład: eastus) Prawda

Limity ograniczania

Nazwa Wywołania Okres odnowienia
Wywołania interfejsu API na połączenie 100 60 sekund

Akcje

Konwertowanie tekstu na mowę

Konwertowanie pojedynczego tekstu na mowę.

Konwertowanie tekstu na mowę przy użyciu języka SSML

Konwertowanie tekstu na mowę przy użyciu języka znaczników syntezy mowy (SSML)

Pobieranie listy głosów

Uzyskaj pełną listę głosów dla określonego regionu lub punktu końcowego.

Konwertowanie tekstu na mowę

Konwertowanie pojedynczego tekstu na mowę.

Parametry

Nazwa Klucz Wymagane Typ Opis
Nazwa głosu
voiceName True string

Dane wyjściowe nazwy głosu dla tekstu na mowę. Na przykład: en-US-JennyNeural.

Lokalizacja
locale True string

Ustawienia regionalne zawartych danych. Na przykład: en-US.

Syntetyzowany tekst
synthesizedText True string

Syntetyzowany tekst, który należy przekonwertować na mowę.

Format dźwięku wyjściowego
outputFormat string

Formaty audio bez przesyłania strumieniowego. Ustawienie domyślne: riff-24khz-16bit-mono-pcm.

Styl
style string

Ekspresowy styl mowy. Na przykład: wesoły.

Wskaźnik mówienia
speakingRate string

Szybkość mowy. Na przykład: -40.00%.

Konwertowanie tekstu na mowę przy użyciu języka SSML

Konwertowanie tekstu na mowę przy użyciu języka znaczników syntezy mowy (SSML)

Parametry

Nazwa Klucz Wymagane Typ Opis
Tekst SSML
ssmlText True string

Tekst w formacie SSML (np. <speak xmlns='http://www.w3.org/2001/10/synthesis' xmlns:mstts='http://www.w3.org/2001/mstts' xmlns:emo='http://www.w3.org/2009/10/emotionml' version='1.0' xml:lang='en-US'><voice name='en-US-ChristopherNeural'power> connector</voice></speak>)

Format dźwięku wyjściowego
outputFormat string

Formaty audio bez przesyłania strumieniowego. Ustawienie domyślne: riff-24khz-16bit-mono-pcm.

Pobieranie listy głosów

Uzyskaj pełną listę głosów dla określonego regionu lub punktu końcowego.

Zwraca

Nazwa Ścieżka Typ Opis
array of object
items
object

macierz