Azure 文字轉語音
Azure 文字轉語音可讓您建置應用程式和服務,以 140 種語言和方言的 400 多種語音自然地說話。
此連接器適用於以下產品和區域:
| 服務 | Class | Regions |
|---|---|---|
| 副駕駛工作室 | 進階 | 除下列區域外的所有 Power Automate 區域 : - 由 21Vianet 營運的中國雲 |
| 邏輯應用程式 | 標準 | 所有 Logic Apps 區域, 但下列區域除外: - Azure 中國區域 |
| Power Apps | 進階 | 除下列區域外的所有 Power Apps 區域 : - 由 21Vianet 營運的中國雲 |
| Power Automate(自動化服務) | 進階 | 除下列區域外的所有 Power Automate 區域 : - 由 21Vianet 營運的中國雲 |
| 連絡人 | |
|---|---|
| 名稱 | 語音服務 Power Platform 小組 |
| URL | https://docs.microsoft.com/azure/cognitive-services/speech-service/support |
| speechpowerplatform@microsoft.com |
| 連接器中繼資料 | |
|---|---|
| Publisher | Microsoft |
| 網站 | https://docs.microsoft.com/azure/cognitive-services/speech-service/ |
| 隱私策略 | https://privacy.microsoft.com |
| 類別 | 人工智慧;網站 |
語音服務可讓您將文字轉換成合成語音,並使用 REST API 取得區域支援的語音清單。
Pre-requisites
您將需要以下內容才能繼續:
- Azure 訂用帳戶 - 建立免費帳戶。
- 在 Azure 入口網站中建立語音資源。
- 取得語音資源金鑰和區域。 部署語音資源之後,選取 [移至資源] 以檢視和管理索引鍵。 如需認知服務資源的詳細資訊,請參閱 取得資源的金鑰。
- 深入瞭解 Azure 文字轉語音 支援的地區設定和語音。
正在建立連線
連接器支援下列驗證類型:
| API 金鑰 | API 金鑰 (ApiKey) | 所有區域 | 可共用 |
| Microsoft Entra ID 整合式 | 使用 Microsoft Entra ID 來存取您的語音服務。 | Azure Government 和 US Government (GCC-High) 中的 Azure Government 和國防部 (DoD) 以外的所有區域 | 不可共享 |
| Microsoft Entra ID 整合式 (Azure 政府) | 使用 Microsoft Entra ID 來存取您的語音服務。 | 僅限 Azure Government 和美國政府 (GCC-High) 中的 Azure Government 和國防部 (DoD) | 不可共享 |
| 預設值 [已棄用] | 此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。 | 所有區域 | 不可共享 |
API 金鑰
驗證 ID:keyBasedAuth
適用:所有地區
API 金鑰 (ApiKey)
這是可共享的連接。 如果 Power App 與其他使用者共用,也會共用連線。 如需詳細資訊,請參閱 畫布應用程式的連接器概觀 - Power Apps |Microsoft 文件
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 帳戶金鑰 | securestring | 語音服務金鑰 | 對 |
| 區域 | 字串 | 語音服務區域 (範例:eastus) | 對 |
Microsoft Entra ID 整合
驗證識別碼:tokenBasedAuth
適用:Azure Government 和美國政府 (GCC-High) 中的 Azure Government 和國防部 (DoD) 以外的所有區域
使用 Microsoft Entra ID 來存取您的語音服務。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 資源識別碼 | 字串 | 認知服務資源識別碼 (範例:/subscriptions/<Subscription ID>/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>) | 對 |
| 自訂子網域 | 字串 | 自訂子網域端點 URL (範例:contoso) | 對 |
Microsoft Entra ID 整合式 (Azure 政府)
驗證識別碼:tokenBasedAuth
適用:僅限 Azure Government 和美國政府 (GCC-High) 中的 Azure Government 和國防部 (DoD)
使用 Microsoft Entra ID 來存取您的語音服務。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 資源識別碼 | 字串 | 認知服務資源識別碼 (範例:/subscriptions/<Subscription ID>/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/<CognitiveServices Resource Name>) | 對 |
| 自訂子網域 | 字串 | 自訂子網域端點 URL (範例:contoso) | 對 |
預設值 [已棄用]
適用:所有地區
此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 帳戶金鑰 | securestring | Azure Cognitive Services for Neural Text-to-speech 帳戶金鑰 | 對 |
| 區域 | 字串 | 語音服務區域 (範例:eastus) | 對 |
節流限制
| 名稱 | 呼叫 | 續約期間 |
|---|---|---|
| 每個連線的 API 呼叫 | 100 | 60 秒 |
動作
| 使用 SSML 將文字轉換為語音 |
使用語音合成標記語言 (SSML) 將文字轉換成語音 |
| 取得語音清單 |
取得特定區域或端點的完整語音清單。 |
| 將文字轉換為語音 |
將單個文本轉換為語音。 |
使用 SSML 將文字轉換為語音
使用語音合成標記語言 (SSML) 將文字轉換成語音
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
SSML 文字
|
ssmlText | True | string |
SSML 格式的文字 (例如 <speak xmlns='http://www.w3.org/2001/10/synthesis' xmlns:mstts='http://www.w3.org/2001/mstts' xmlns:emo=';http://www.w3.org/2009/10/emotionml' version='1.0' xml:lang='en-US'><voice name='en-US-ChristopherNeural'power> connector</voice></speak>) |
|
輸出音訊格式
|
outputFormat | string |
非串流音訊格式。 預設值:riff-24khz-16bit-mono-pcm。 |
取得語音清單
取得特定區域或端點的完整語音清單。
傳回
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
|
array of object | ||
|
items
|
object |
陣列 |
將文字轉換為語音
將單個文本轉換為語音。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
語音名稱
|
voiceName | True | string |
文字轉語音的語音名稱輸出。 例如:en-US-JennyNeural。 |
|
Locale
|
locale | True | string |
所包含資料的地區設定。 例如:en-US。 |
|
合成文本
|
synthesizedText | True | string |
需要轉換為語音的合成文字。 |
|
輸出音訊格式
|
outputFormat | string |
非串流音訊格式。 預設值:riff-24khz-16bit-mono-pcm。 |
|
|
Style
|
style | string |
表達的演講風格。 例如:開朗。 |
|
|
說話率
|
speakingRate | string |
語速。 例如:-40.00%。 |