Freigeben über


Azure Text zu Sprache

Mit Azure Text-zu-Sprache können Sie Apps und Dienste erstellen, die natürlich mit mehr als 400 Stimmen in 140 Sprachen und Dialekten sprechen.

Dieser Connector ist in den folgenden Produkten und Regionen verfügbar:

Dienstleistung Class Regions
Copilot Studio Premium Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche:
     - China Cloud betrieben von 21Vianet
Logik-Apps Norm Alle Logik-Apps-Regionen mit Ausnahme der folgenden Bereiche:
     - Azure China-Regionen
Power Apps Premium Alle Power Apps-Regionen mit Ausnahme der folgenden:
     - China Cloud betrieben von 21Vianet
Power Automate Premium Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche:
     - China Cloud betrieben von 21Vianet
Kontakt
Name Power Platform-Team des Sprachdiensts
URL https://docs.microsoft.com/azure/cognitive-services/speech-service/support
Email speechpowerplatform@microsoft.com
Connectormetadaten
Herausgeber Microsoft
Webseite https://docs.microsoft.com/azure/cognitive-services/speech-service/
Datenschutzrichtlinie https://privacy.microsoft.com
Kategorien Künstliche Intelligenz; Website

Mit dem Spracherkennungsdienst können Sie Text in synthetisierte Sprache konvertieren und eine Liste der unterstützten Stimmen für einen Bereich mithilfe einer REST-API abrufen.

Voraussetzungen

Sie benötigen Folgendes, um fortzufahren:

Erstellen einer Verbindung

Der Connector unterstützt die folgenden Authentifizierungstypen:

API-Schlüssel API-Schlüssel Alle Regionen Freigabefähig
Microsoft Entra ID-integriert Verwenden Sie die Microsoft Entra-ID, um auf Ihren Sprachdienst zuzugreifen. Alle Regionen mit Ausnahme von Azure Government und Department of Defense (DoD) in Azure Government und US Government (GCC-High) Nicht teilbar
Microsoft Entra ID Integrated (Azure Government) Verwenden Sie die Microsoft Entra-ID, um auf Ihren Sprachdienst zuzugreifen. Nur Azure Government und Department of Defense (DoD) in Azure Government und US Government (GCC-High) Nicht teilbar
Standard [VERALTET] Diese Option ist nur für ältere Verbindungen ohne expliziten Authentifizierungstyp vorgesehen und wird nur aus Gründen der Abwärtskompatibilität bereitgestellt. Alle Regionen Nicht teilbar

API-Schlüssel

Auth-ID: keyBasedAuth

Anwendbar: Alle Regionen

API-Schlüssel

Dies ist eine freigabefähige Verbindung. Wenn die Power-App für einen anderen Benutzer freigegeben wird, wird auch die Verbindung freigegeben. Weitere Informationen finden Sie in der Übersicht über Connectors für Canvas-Apps – Power Apps | Microsoft-Dokumente

Name Typ Description Erforderlich
Kontoschlüssel securestring Sprachdienstschlüssel Richtig
Region Schnur Sprachdienstregion (Beispiel: Ostus) Richtig

Microsoft Entra ID integriert

Auth-ID: tokenBasedAuth

Anwendbar: Alle Regionen mit Ausnahme von Azure Government und Department of Defense (DoD) in Azure Government und US Government (GCC-High)

Verwenden Sie die Microsoft Entra-ID, um auf Ihren Sprachdienst zuzugreifen.

Dies ist keine freigabefähige Verbindung. Wenn die Power-App für einen anderen Benutzer freigegeben wird, wird ein anderer Benutzer aufgefordert, eine neue Verbindung explizit zu erstellen.

Name Typ Description Erforderlich
Ressourcen-ID Schnur Die Ressourcen-ID der kognitiven Dienste (Beispiel: /subscriptions/<Subscription ID>/resourceGroups/ResourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>) Richtig
Benutzerdefinierte Unterdomäne Schnur Url des benutzerdefinierten Unterdomänenendpunkts (Beispiel: contoso) Richtig

Microsoft Entra ID Integrated (Azure Government)

Auth-ID: tokenBasedAuth

Anwendbar: Nur Azure Government and Department of Defense (DoD) in Azure Government und US Government (GCC-High)

Verwenden Sie die Microsoft Entra-ID, um auf Ihren Sprachdienst zuzugreifen.

Dies ist keine freigabefähige Verbindung. Wenn die Power-App für einen anderen Benutzer freigegeben wird, wird ein anderer Benutzer aufgefordert, eine neue Verbindung explizit zu erstellen.

Name Typ Description Erforderlich
Ressourcen-ID Schnur Die Ressourcen-ID der kognitiven Dienste (Beispiel: /subscriptions/<Subscription ID>/resourceGroups/ResourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>) Richtig
Benutzerdefinierte Unterdomäne Schnur Url des benutzerdefinierten Unterdomänenendpunkts (Beispiel: contoso) Richtig

Standard [VERALTET]

Anwendbar: Alle Regionen

Diese Option ist nur für ältere Verbindungen ohne expliziten Authentifizierungstyp vorgesehen und wird nur aus Gründen der Abwärtskompatibilität bereitgestellt.

Dies ist keine freigabefähige Verbindung. Wenn die Power-App für einen anderen Benutzer freigegeben wird, wird ein anderer Benutzer aufgefordert, eine neue Verbindung explizit zu erstellen.

Name Typ Description Erforderlich
Kontoschlüssel securestring Azure Cognitive Services für neuralen Text-zu-Sprache-Kontoschlüssel Richtig
Region Schnur Sprachdienstregion (Beispiel: Ostus) Richtig

Drosselungsgrenzwerte

Name Aufrufe Verlängerungszeitraum
API-Aufrufe pro Verbindung 100 60 Sekunden

Aktionen

Konvertieren von Text in Sprache

Konvertieren sie einzelnen Text in Sprache.

Konvertieren von Text in Sprache mit SSML

Konvertieren von Text in Sprache mithilfe von Speech Synthesis Markup Language (SSML)

Liste der Stimmen abrufen

Rufen Sie eine vollständige Liste der Stimmen für eine bestimmte Region oder einen bestimmten Endpunkt ab.

Konvertieren von Text in Sprache

Konvertieren sie einzelnen Text in Sprache.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Sprachname
voiceName True string

Die Sprachnamenausgabe für Text in Sprache. Beispiel: en-US-JenniferNeural.

Gebietsschema
locale True string

Das Gebietsschema der enthaltenen Daten. Beispiel: en-US.

Synthetisierter Text
synthesizedText True string

Der synthetisierte Text, der in sprache konvertiert werden muss.

Ausgabeaudioformat
outputFormat string

Die Nicht-Streaming-Audioformate. Standard: riff-24khz-16bit-mono-pcm.

Stil
style string

Der ausdrucksartige Sprachstil. Zum Beispiel: fröhlich.

Sprechrate
speakingRate string

Die Geschwindigkeitsrate der Sprache. Beispiel: -40.00%.

Konvertieren von Text in Sprache mit SSML

Konvertieren von Text in Sprache mithilfe von Speech Synthesis Markup Language (SSML)

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
SSML-Text
ssmlText True string

Der Text im SSML-Format (z. B. <speak xmlns='http://www.w3.org/2001/10/synthesis' xmlns:mstts='http://www.w3.org/2001/mstts' xmlns:emo='http://www.w3.org/2009/10/emotionml' version='1.0' xml:lang='en-US'><voice name='en-US-ChristopherNeural'power> connector</voice></speak>)

Ausgabeaudioformat
outputFormat string

Die Nicht-Streaming-Audioformate. Standard: riff-24khz-16bit-mono-pcm.

Liste der Stimmen abrufen

Rufen Sie eine vollständige Liste der Stimmen für eine bestimmte Region oder einen bestimmten Endpunkt ab.

Gibt zurück

Name Pfad Typ Beschreibung
array of object
items
object

Array