Partager via


Synthèse vocale Azure

La synthèse vocale Azure vous permet de créer des applications et des services qui parlent naturellement avec plus de 400 voix dans 140 langues et dialectes.

Ce connecteur est disponible dans les produits et régions suivants :

Service classe Régions
Copilot Studio Premium Toutes les régions Power Automate , à l’exception des éléments suivants :
     - China Cloud géré par 21Vianet
Applications logiques Norme Toutes les régions Logic Apps , à l’exception des suivantes :
     - Régions Azure Chine
Power Apps Premium Toutes les régions Power Apps , à l’exception des suivantes :
     - China Cloud géré par 21Vianet
Power Automate Premium Toutes les régions Power Automate , à l’exception des éléments suivants :
     - China Cloud géré par 21Vianet
Contact
Nom Équipe Power Platform du service Speech
URL https://docs.microsoft.com/azure/cognitive-services/speech-service/support
Messagerie électronique speechpowerplatform@microsoft.com
Métadonnées du connecteur
Éditeur Microsoft
Site internet https://docs.microsoft.com/azure/cognitive-services/speech-service/
Politique de confidentialité https://privacy.microsoft.com
Catégories IA; Site internet

Le service Speech vous permet de convertir du texte en synthèse vocale et d’obtenir la liste des voix prises en charge pour une région à l’aide d’une API REST.

Conditions préalables

Vous devez procéder comme suit :

Création d’une connexion

Le connecteur prend en charge les types d’authentification suivants :

Clé API ApiKey Toutes les régions Partageable
Microsoft Entra ID Intégré Utilisez l’ID Microsoft Entra pour accéder à votre service speech. Toutes les régions à l’exception d’Azure Government et du Ministère de la Défense (DoD) dans Azure Government et us Government (GCC-High) Non partageable
Microsoft Entra ID Integrated (Azure Government) Utilisez l’ID Microsoft Entra pour accéder à votre service speech. Azure Government and Department of Defense (DoD) dans Azure Government et US Government (GCC-High) uniquement Non partageable
Valeur par défaut [DÉCONSEILLÉE] Cette option concerne uniquement les connexions plus anciennes sans type d’authentification explicite et est fournie uniquement pour la compatibilité descendante. Toutes les régions Non partageable

Clé API

ID d’authentification : keyBasedAuth

Applicable : Toutes les régions

ApiKey

Il s’agit d’une connexion partageable. Si l’application d’alimentation est partagée avec un autre utilisateur, la connexion est également partagée. Pour plus d’informations, consultez la vue d’ensemble des connecteurs pour les applications de canevas - Power Apps | Microsoft Docs

Nom Type Descriptif Obligatoire
Clé de compte securestring Clé du service Speech Vrai
Région ficelle Région du service Speech (exemple : eastus) Vrai

Identifiant Microsoft Entra intégré

ID d’authentification : tokenBasedAuth

Applicable : Toutes les régions à l’exception d’Azure Government et du Ministère de la Défense (DoD) dans Azure Government et us Government (GCC-High)

Utilisez l’ID Microsoft Entra pour accéder à votre service speech.

Cette connexion n’est pas partageable. Si l’application power est partagée avec un autre utilisateur, un autre utilisateur est invité à créer une connexion explicitement.

Nom Type Descriptif Obligatoire
ID de ressource ficelle ID de ressource cognitive services (exemple : /subscriptions/<SUBSCRIPTION ID>/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>) Vrai
Sous-domaine personnalisé ficelle URL de point de terminaison de sous-domaine personnalisé (exemple : contoso) Vrai

Microsoft Entra ID Integrated (Azure Government)

ID d’authentification : tokenBasedAuth

Applicable : Azure Government and Department of Defense (DoD) dans Azure Government et US Government (GCC-High) uniquement

Utilisez l’ID Microsoft Entra pour accéder à votre service speech.

Cette connexion n’est pas partageable. Si l’application power est partagée avec un autre utilisateur, un autre utilisateur est invité à créer une connexion explicitement.

Nom Type Descriptif Obligatoire
ID de ressource ficelle ID de ressource cognitive services (exemple : /subscriptions/<SUBSCRIPTION ID>/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>) Vrai
Sous-domaine personnalisé ficelle URL de point de terminaison de sous-domaine personnalisé (exemple : contoso) Vrai

Valeur par défaut [DÉCONSEILLÉE]

Applicable : Toutes les régions

Cette option concerne uniquement les connexions plus anciennes sans type d’authentification explicite et est fournie uniquement pour la compatibilité descendante.

Cette connexion n’est pas partageable. Si l’application power est partagée avec un autre utilisateur, un autre utilisateur est invité à créer une connexion explicitement.

Nom Type Descriptif Obligatoire
Clé de compte securestring Azure Cognitive Services pour la clé de compte de synthèse vocale neuronale Vrai
Région ficelle Région du service Speech (exemple : eastus) Vrai

Limitations

Nom Appels Période de renouvellement
Appels d’API par connexion 100 60 secondes

Actions

Convertir du texte en parole avec SSML

Convertir du texte en parole à l’aide du langage SSML (Speech Synthesis Markup Language)

Convertir du texte en synthèse vocale

Convertissez du texte unique en synthèse vocale.

Obtenir la liste des voix

Obtenez une liste complète des voix pour une région ou un point de terminaison spécifique.

Convertir du texte en parole avec SSML

Convertir du texte en parole à l’aide du langage SSML (Speech Synthesis Markup Language)

Paramètres

Nom Clé Obligatoire Type Description
Texte SSML
ssmlText True string

Texte au format SSML (par exemple <, speak xmlns='http://www.w3.org/2001/10/synthesis' ; xmlns :mstts='http://www.w3.org/2001/mstts' ; xmlns :emo='http://www.w3.org/2009/10/emotionml' ; version='1.0' xml :lang='en-US'><voice name='en-US-ChristopherNeural’power> connector</voice></speak>)

Format audio de sortie
outputFormat string

Formats audio non diffusés en continu. Par défaut : riff-24khz-16bit-mono-pcm.

Convertir du texte en synthèse vocale

Convertissez du texte unique en synthèse vocale.

Paramètres

Nom Clé Obligatoire Type Description
Nom vocal
voiceName True string

Sortie du nom de la voix pour la synthèse vocale. Par exemple : en-US-JennyNeural.

Paramètres régionaux
locale True string

Paramètres régionaux des données contenues. Par exemple : en-US.

Texte synthétisé
synthesizedText True string

Texte synthétisé qui doit être converti en parole.

Format audio de sortie
outputFormat string

Formats audio non diffusés en continu. Par défaut : riff-24khz-16bit-mono-pcm.

Style
style string

Style express de la parole. Par exemple : joyeux.

Taux de parole
speakingRate string

Vitesse de la parole. Par exemple : -40.00%.

Obtenir la liste des voix

Obtenez une liste complète des voix pour une région ou un point de terminaison spécifique.

Retours

Nom Chemin d’accès Type Description
array of object
items
object

tableau