Compartilhar via


Texto do Azure para fala

A conversão de texto em fala do Azure permite que você crie aplicativos e serviços que falam naturalmente com mais de 400 vozes em 140 idiomas e dialetos.

Esse conector está disponível nos seguintes produtos e regiões:

Service Class Regions
Copilot Studio Premium Todas as regiões do Power Automate , exceto as seguintes:
     - China Cloud operado pela 21Vianet
Aplicativos Lógicos Standard Todas as regiões dos Aplicativos Lógicos , exceto as seguintes:
     - Regiões do Azure China
Power Apps Premium Todas as regiões do Power Apps , exceto as seguintes:
     - China Cloud operado pela 21Vianet
Power Automate Premium Todas as regiões do Power Automate , exceto as seguintes:
     - China Cloud operado pela 21Vianet
Contato
Nome Equipe do Power Platform do Serviço de Fala
URL https://docs.microsoft.com/azure/cognitive-services/speech-service/support
Email speechpowerplatform@microsoft.com
Metadados do conector
Publicador Microsoft
Site https://docs.microsoft.com/azure/cognitive-services/speech-service/
Política de privacidade https://privacy.microsoft.com
Categorias IA; Site

O serviço de Fala permite converter texto em fala sintetizada e obter uma lista de vozes com suporte para uma região usando uma API REST.

Pré-requisitos

Você precisará do seguinte para continuar:

Criando uma conexão

O conector dá suporte aos seguintes tipos de autenticação:

Chave de API ApiKey Todas as regiões Compartilhável
Microsoft Entra ID Integrado Use a ID do Microsoft Entra para acessar seu serviço de fala. Todas as regiões, exceto o Azure Governamental e o Departamento de Defesa (DoD) no Azure Governamental e no Governo dos EUA (GCC-High) Não compartilhável
Microsoft Entra ID Integrada (Azure Government) Use a ID do Microsoft Entra para acessar seu serviço de fala. Governo do Azure e Departamento de Defesa (DoD) somente no Azure Governamental e no Governo dos EUA (GCC-High) Não compartilhável
Padrão [PRETERIDO] Essa opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores. Todas as regiões Não compartilhável

Chave de API

ID de autenticação: keyBasedAuth

Aplicável: todas as regiões

ApiKey

Essa é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, a conexão também será compartilhada. Para obter mais informações, consulte a visão geral dos Conectores para aplicativos de tela – Power Apps | Microsoft Docs

Nome Tipo Description Obrigatório
Chave de Conta secureString Chave do serviço de fala Verdade
Região cadeia Região do serviço de fala (exemplo: eastus) Verdade

Microsoft Entra ID Integrado

ID de autenticação: tokenBasedAuth

Aplicável: todas as regiões, exceto o Azure Governamental e o Departamento de Defesa (DoD) no Azure Governamental e no Governo dos EUA (GCC-High)

Use a ID do Microsoft Entra para acessar seu serviço de fala.

Essa não é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
ID de Recurso cadeia A ID do recurso dos serviços cognitivos (exemplo: /subscriptions/ID da< assinatura/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>)> Verdade
Subdomínio Personalizado cadeia URL do ponto de extremidade de subdomínio personalizado (exemplo: contoso) Verdade

Microsoft Entra ID Integrada (Azure Government)

ID de autenticação: tokenBasedAuth

Aplicável: Azure Governamental e Departamento de Defesa (DoD) somente no Azure Governamental e no Governo dos EUA (GCC-High)

Use a ID do Microsoft Entra para acessar seu serviço de fala.

Essa não é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
ID de Recurso cadeia A ID do recurso dos serviços cognitivos (exemplo: /subscriptions/ID da< assinatura/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>)> Verdade
Subdomínio Personalizado cadeia URL do ponto de extremidade de subdomínio personalizado (exemplo: contoso) Verdade

Padrão [PRETERIDO]

Aplicável: todas as regiões

Essa opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores.

Essa não é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
Chave de Conta secureString Chave de conta de conversão de texto em fala dos Serviços Cognitivos do Azure Verdade
Região cadeia Região do serviço de fala (exemplo: eastus) Verdade

Limitações

Nome Chamadas Período de renovação
Chamadas à API por conexão 100 60 segundos

Ações

Converter texto em fala

Converter texto único em fala.

Converter texto em fala com SSML

Converter texto em fala usando SSML (Linguagem de Marcação de Síntese de Fala)

Obter lista de vozes

Obtenha uma lista completa de vozes para uma região ou ponto de extremidade específico.

Converter texto em fala

Converter texto único em fala.

Parâmetros

Nome Chave Obrigatório Tipo Description
Nome da Voz
voiceName True string

A saída do nome de voz para conversão de texto em fala. Por exemplo: en-US-JennyNeural.

Local
locale True string

A localidade dos dados contidos. Por exemplo: en-US.

Texto sintetizado
synthesizedText True string

O texto sintetizado que precisa ser convertido em fala.

Formato de áudio de saída
outputFormat string

Os formatos de áudio sem streaming. Padrão: riff-24khz-16bit-mono-pcm.

Estilo
style string

O estilo expresso de fala. Por exemplo: alegre.

Taxa de Fala
speakingRate string

A taxa de velocidade da fala. Por exemplo: -40.00%.

Converter texto em fala com SSML

Converter texto em fala usando SSML (Linguagem de Marcação de Síntese de Fala)

Parâmetros

Nome Chave Obrigatório Tipo Description
Texto SSML
ssmlText True string

O texto no formato SSML (por exemplo <, speak xmlns='http://www.w3.org/2001/10/synthesis' xmlns:mstts='http://www.w3.org/2001/mstts' xmlns:emo='http://www.w3.org/2009/10/emotionml' version='1.0' xml:lang='en-US'><voice name='en-US-ChristopherNeural'power> connector</voice></speak>)

Formato de áudio de saída
outputFormat string

Os formatos de áudio sem streaming. Padrão: riff-24khz-16bit-mono-pcm.

Obter lista de vozes

Obtenha uma lista completa de vozes para uma região ou ponto de extremidade específico.

Retornos

Nome Caminho Tipo Description
array of object
items
object

matriz