Partilhar via


Azure Texto para fala

O Azure Text-to-speech permite-lhe criar aplicações e serviços que falam naturalmente com mais de 400 vozes em 140 idiomas e dialetos.

Este conector está disponível nos seguintes produtos e regiões:

Serviço Class Regiões
Estúdio Copiloto Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - China Cloud operado pela 21Vianet
Aplicações Lógicas Standard Todas as regiões do Logic Apps , exceto as seguintes:
     - Regiões do Azure China
Aplicações Power Premium Todas as regiões do Power Apps , exceto as seguintes:
     - China Cloud operado pela 21Vianet
Automatize o poder Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - China Cloud operado pela 21Vianet
Contato
Nome Equipe de Plataforma de Energia do Serviço de Fala
URL https://docs.microsoft.com/azure/cognitive-services/speech-service/support
Email speechpowerplatform@microsoft.com
Metadados do conector
Editora Microsoft
Sítio Web https://docs.microsoft.com/azure/cognitive-services/speech-service/
Política de privacidade https://privacy.microsoft.com
Categorias IA; Sítio Web

O serviço de Fala permite converter texto em fala sintetizada e obter uma lista de vozes suportadas para uma região usando uma API REST.

Pre-requisites

Você precisará do seguinte para prosseguir:

A criar uma ligação

O conector suporta os seguintes tipos de autenticação:

Chave Api ApiKey Todas as regiões Compartilhável
Microsoft Entra ID Integrado Use o Microsoft Entra ID para acessar seu serviço de fala. Todas as regiões, exceto o Azure Government e o Department of Defense (DoD) no Azure Government e no US Government (GCC-High) Não compartilhável
Microsoft Entra ID Integrated (Azure Government) Use o Microsoft Entra ID para acessar seu serviço de fala. Azure Government and Department of Defense (DoD) no Azure Government e US Government (GCC-High) apenas Não compartilhável
Padrão [DEPRECATED] Esta opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores. Todas as regiões Não compartilhável

Chave Api

ID de autenticação: keyBasedAuth

Aplicável: Todas as regiões

ApiKey

Esta é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, a conexão também será compartilhada. Para obter mais informações, consulte a Visão geral de conectores para aplicativos de tela - Power Apps | Documentos Microsoft

Nome Tipo Description Obrigatório
Chave da conta securestring Chave do serviço de fala Verdade
Região cadeia (de caracteres) Região do serviço de fala (Exemplo: eastus) Verdade

ID do Microsoft Entra Integrado

ID de autenticação: tokenBasedAuth

Aplicável: Todas as regiões, exceto o Azure Government e o Department of Defense (DoD) no Azure Government e no US Government (GCC-High)

Use o Microsoft Entra ID para acessar seu serviço de fala.

Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
ID do Recurso cadeia (de caracteres) A ID do recurso de serviços cognitivos (Exemplo: /subscriptions/<Subscription ID>/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>) Verdade
Subdomínio personalizado cadeia (de caracteres) URL do ponto de extremidade do subdomínio personalizado (Exemplo: contoso) Verdade

Microsoft Entra ID Integrated (Azure Government)

ID de autenticação: tokenBasedAuth

Aplicável: Azure Government e Department of Defense (DoD) apenas no Azure Government e no US Government (GCC-High)

Use o Microsoft Entra ID para acessar seu serviço de fala.

Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
ID do Recurso cadeia (de caracteres) A ID do recurso de serviços cognitivos (Exemplo: /subscriptions/<Subscription ID>/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>) Verdade
Subdomínio personalizado cadeia (de caracteres) URL do ponto de extremidade do subdomínio personalizado (Exemplo: contoso) Verdade

Padrão [DEPRECATED]

Aplicável: Todas as regiões

Esta opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores.

Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
Chave da conta securestring Serviços Cognitivos do Azure para chave de conta de conversão de texto em fala neural Verdade
Região cadeia (de caracteres) Região do serviço de fala (Exemplo: eastus) Verdade

Limites de Limitação

Name Chamadas Período de Renovação
Chamadas de API por conexão 100 60 segundos

Ações

Converter texto em fala

Converta texto único em fala.

Converter texto em fala com SSML

Converter texto em fala usando o SSML (Speech Synthesis Markup Language)

Obter lista de vozes

Obtenha uma lista completa de vozes para uma região ou ponto de extremidade específico.

Converter texto em fala

Converta texto único em fala.

Parâmetros

Name Chave Necessário Tipo Description
Nome da voz
voiceName True string

A saída do nome de voz para conversão de texto em fala. Por exemplo: en-US-JennyNeural.

Localidade
locale True string

A localidade dos dados contidos. Por exemplo: en-US.

Texto sintetizado
synthesizedText True string

O texto sintetizado que precisa ser convertido em fala.

Formato de saída de áudio
outputFormat string

Os formatos de áudio sem streaming. Padrão: riff-24khz-16bit-mono-pcm.

Estilo
style string

O estilo expresso de falar. Por exemplo: alegre.

Taxa de Expressão Oral
speakingRate string

A velocidade da fala. Por exemplo: -40,00%.

Converter texto em fala com SSML

Converter texto em fala usando o SSML (Speech Synthesis Markup Language)

Parâmetros

Name Chave Necessário Tipo Description
Texto SSML
ssmlText True string

O texto em formato SSML (por exemplo, <speak xmlns='http://www.w3.org/2001/10/synthesis' xmlns:mstts='http://www.w3.org/2001/mstts' xmlns:emo='http://www.w3.org/2009/10/emotionml' version='1.0' xml:lang='en-US'><voice name='en-US-ChristopherNeural'power> connector</voice></speak>)

Formato de saída de áudio
outputFormat string

Os formatos de áudio sem streaming. Padrão: riff-24khz-16bit-mono-pcm.

Obter lista de vozes

Obtenha uma lista completa de vozes para uma região ou ponto de extremidade específico.

Devoluções

Name Caminho Tipo Description
array of object
items
object

matriz