Azure Batch 語音轉文字
準確地將音訊轉錄為 100 多種語言和變體的文字。 作為 Azure AI 語音服務的一部分,批次轉譯可讓您在儲存體中轉譯大量音訊。 您可使用共用存取簽章 (SAS) URI 來指向音訊檔案,並以非同步方式接收轉譯結果。
此連接器適用於以下產品和區域:
| 服務 | Class | Regions |
|---|---|---|
| 副駕駛工作室 | 標準 | 除下列區域外的所有 Power Automate 區域 : - 由 21Vianet 營運的中國雲 |
| 邏輯應用程式 | 標準 | 所有 Logic Apps 區域, 但下列區域除外: - Azure 中國區域 |
| Power Apps | 標準 | 除下列區域外的所有 Power Apps 區域 : - 由 21Vianet 營運的中國雲 |
| Power Automate(自動化服務) | 標準 | 除下列區域外的所有 Power Automate 區域 : - 由 21Vianet 營運的中國雲 |
| 連絡人 | |
|---|---|
| 名稱 | 語音服務 Power Platform 小組 |
| URL | https://docs.microsoft.com/azure/cognitive-services/speech-service/support |
| speechpowerplatform@microsoft.com |
| 連接器中繼資料 | |
|---|---|
| Publisher | Microsoft |
| 網站 | https://docs.microsoft.com/azure/cognitive-services/speech-service/ |
| 隱私策略 | https://privacy.microsoft.com |
| 類別 | 人工智慧;網站 |
語音服務批次轉錄 API 是雲端式服務,可針對提供的音訊內容提供批次語音辨識非同步處理。 此連接器會將這些函式公開為 Microsoft Power Automate 和 Power Apps 中的作業。
Pre-requisites
您將需要以下內容才能繼續:
- Azure 訂用帳戶 - 建立免費帳戶
- 在 Azure 入口網站中建立語音資源。
- 取得語音資源金鑰和區域。 部署語音資源之後,選取 [移至資源] 以檢視和管理索引鍵。 如需認知服務資源的詳細資訊,請參閱 取得資源的金鑰。
- 上傳您自己的數據,或透過公用 URI 或 共用存取簽章 (SAS) URI 使用現有的音訊檔案。 在這裡了解更多
正在建立連線
連接器支援下列驗證類型:
| API 金鑰 | API 金鑰 (ApiKey) | 所有區域 | 可共用 |
| Microsoft Entra ID 整合式 | 使用 Microsoft Entra ID 來存取您的語音服務。 | Azure Government 和 US Government (GCC-High) 中的 Azure Government 和國防部 (DoD) 以外的所有區域 | 不可共享 |
| Microsoft Entra ID 整合式 (Azure 政府) | 使用 Microsoft Entra ID 來存取您的語音服務。 | 僅限 Azure Government 和美國政府 (GCC-High) 中的 Azure Government 和國防部 (DoD) | 不可共享 |
| 預設值 [已棄用] | 此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。 | 所有區域 | 不可共享 |
API 金鑰
驗證 ID:keyBasedAuth
適用:所有地區
API 金鑰 (ApiKey)
這是可共享的連接。 如果 Power App 與其他使用者共用,也會共用連線。 如需詳細資訊,請參閱 畫布應用程式的連接器概觀 - Power Apps |Microsoft 文件
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 帳戶金鑰 | securestring | 語音服務金鑰 | 對 |
| 區域 | 字串 | 語音服務區域 (範例:eastus) | 對 |
Microsoft Entra ID 整合
驗證識別碼:tokenBasedAuth
適用:Azure Government 和美國政府 (GCC-High) 中的 Azure Government 和國防部 (DoD) 以外的所有區域
使用 Microsoft Entra ID 來存取您的語音服務。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 自訂子網域 | 字串 | 自訂子網域端點 URL (範例:contoso) | 對 |
Microsoft Entra ID 整合式 (Azure 政府)
驗證識別碼:tokenBasedAuth
適用:僅限 Azure Government 和美國政府 (GCC-High) 中的 Azure Government 和國防部 (DoD)
使用 Microsoft Entra ID 來存取您的語音服務。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 自訂子網域 | 字串 | 自訂子網域端點 URL (範例:contoso) | 對 |
預設值 [已棄用]
適用:所有地區
此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 帳戶金鑰 | securestring | 適用於批次語音轉文字帳戶金鑰的 Azure 認知服務 | 對 |
| 區域 | 字串 | 語音服務區域 (範例:eastus) | 對 |
節流限制
| 名稱 | 呼叫 | 續約期間 |
|---|---|---|
| 每個連線的 API 呼叫 | 100 | 60 秒 |
動作
| 刪除轉錄 (V3.1) |
刪除指定的轉錄任務。 |
| 取得支援的地區設定 (V3.1) |
取得離線轉錄支援的地區設定清單。 |
| 取得轉譯清單檔案 (V3.1) |
取得指定 ID 所識別的轉錄檔案。 |
| 取得轉錄 (V3.1) |
取得指定 ID 所識別的轉錄。 |
| 取得轉錄檔案 (V3.1) |
從轉錄 (以 id 識別) 取得一個特定檔案 (以 fileId 識別) 。 |
| 取得轉錄清單 (V3.1) |
取得已驗證訂用帳戶的轉錄清單。 |
| 建立轉錄 (V3.1) |
建立新的轉錄。 |
| 更新轉錄 (V3.1) |
更新其識別所識別轉錄的可變詳細資料。 |
刪除轉錄 (V3.1)
刪除指定的轉錄任務。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
Id
|
id | True | uuid |
轉錄的識別碼。 |
取得支援的地區設定 (V3.1)
取得離線轉錄支援的地區設定清單。
傳回
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
|
array of string |
取得轉譯清單檔案 (V3.1)
取得指定 ID 所識別的轉錄檔案。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
Id
|
id | True | uuid |
轉錄的識別碼。 |
|
SAS 有效性(以秒為單位)
|
sasValidityInSeconds | integer |
SAS URL 應該有效的持續時間 (以秒為單位)。 預設持續時間為 12 小時。 使用 BYOS ()https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-encryption-of-data-at-rest#bring-your-own-storage-byos-for-customization-and-logging 時:值為 0 表示會產生沒有 SAS 權杖的純 Blob URI。 |
|
|
跳過
|
skip | integer |
將略過的資料集數目。 |
|
|
前幾個
|
top | integer |
略過後將包含的資料集數目。 |
|
|
Filter
|
filter | string |
用於選取可用檔案子集的篩選運算式。
|
傳回
取得轉錄 (V3.1)
取得轉錄檔案 (V3.1)
從轉錄 (以 id 識別) 取得一個特定檔案 (以 fileId 識別) 。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
Id
|
id | True | uuid |
轉錄的識別碼。 |
|
檔案標識碼
|
fileId | True | uuid |
檔案的識別碼。 |
|
SAS 有效性(以秒為單位)
|
sasValidityInSeconds | integer |
SAS URL 應該有效的持續時間 (以秒為單位)。 預設持續時間為 12 小時。 使用 BYOS ()https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-encryption-of-data-at-rest#bring-your-own-storage-byos-for-customization-and-logging 時:值為 0 表示會產生沒有 SAS 權杖的純 Blob URI。 |
傳回
- 身體
- File
取得轉錄清單 (V3.1)
取得已驗證訂用帳戶的轉錄清單。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
跳過
|
skip | integer |
將略過的資料集數目。 |
|
|
前幾個
|
top | integer |
略過後將包含的資料集數目。 |
|
|
Filter
|
filter | string |
用於選取可用轉錄子集的篩選運算式。
|
傳回
建立轉錄 (V3.1)
建立新的轉錄。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
內容網址
|
contentUrls | array of uri |
您可以提供內容 URL 清單,以取得要轉錄的音訊檔案。 最多允許 1000 個 URL。此屬性不會在回應中傳回。 |
|
|
contentContainerUrl
|
contentContainerUrl | uri |
或者,您可以提供包含音訊檔案之 Azure Blob 容器的 URL。 容器的大小上限為 5GB,Blob 數目上限為 10000 個。Blob 的大小上限為 2.5GB。容器 SAS 應該包含 'r' (讀取) 和 'l' (清單) 許可權。此屬性不會在回應中傳回。 |
|
|
地區設定
|
locale | True | string |
所包含資料的地區設定。 如果使用語言識別,則此語言環境用於轉錄無法偵測到任何語言的語音。 |
|
顯示名稱
|
displayName | True | string |
物件的顯示名稱。 |
|
型號
|
self | uri |
參考實體的位置。 |
|
|
diarization已啟用
|
diarizationEnabled | boolean |
指出是否要求分化 (說話者識別) 的值。 預設值為 |
|
|
wordLevelTimestamps已啟用
|
wordLevelTimestampsEnabled | boolean |
指出是否要求單字層次時間戳記的值。 預設值為 |
|
|
displayFormWordLevelTimestamps已啟用
|
displayFormWordLevelTimestampsEnabled | boolean |
指出是否要求顯示表單的單字層級時間戳記的值。 預設值是 |
|
|
通道
|
channels | array of integer |
所要求通道號碼的集合。在預設情況下,會考慮通道 0 和 1。 |
|
|
目的地容器網址
|
destinationContainerUrl | uri |
請求的目的地容器。### 備註 ###When 將目的地容器與 結合 |
|
|
標點符號模式
|
punctuationMode | string |
用於標點符號的模式。 |
|
|
褻瀆篩選模式
|
profanityFilterMode | string |
褻瀆過濾的模式。 |
|
|
timeToLive
|
timeToLive | string |
轉錄完成後將在系統中保留多長時間。 一旦轉錄達到完成後的存留時間(成功或失敗),它將被自動刪除。 不設定此值或將其設定為 0 將停用自動刪除。 支援的最長持續時間為 31 天。持續時間編碼為 ISO 8601 持續時間 (“PnYnMnDTnHnMnS”,請參閱 https://en.wikipedia.org/wiki/ISO_8601#Durations)。 |
|
|
minCount
|
minCount | integer |
用於日記化的最小發言者數量的提示。 必須小於或等於 maxSpeakers 屬性。 |
|
|
maxCount
|
maxCount | integer |
用於分發的說話者數目上限。 必須小於 36,且大於或等於 minSpeakers 屬性。 |
|
|
candidateLocales
|
candidateLocales | True | array of string |
語言識別的候選地區設定 (範例 [“en-US”, “de-DE”, “es-ES”])。 支援最少 2 個和最多 10 個候選地區設定,包括轉錄的主要地區設定。 |
|
語音模型對應
|
speechModelMapping | object |
地區設定與語音模型實體的選擇性對應。 如果未為地區設定提供任何模型,則會使用預設基本模型。索引鍵必須是候選地區設定中包含的地區設定,值是個別地區設定模型的實體。 |
|
|
電子郵件
|
string |
作業完成時要傳送電子郵件通知的電子郵件地址。成功發送電子郵件後,該值將被刪除。 |
傳回
更新轉錄 (V3.1)
更新其識別所識別轉錄的可變詳細資料。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
Id
|
id | True | uuid |
轉錄的識別碼。 |
|
自我
|
self | True | uri |
參考實體的位置。 |
|
顯示名稱
|
displayName | string |
物件的名稱。 |
|
|
說明
|
description | string |
物件的描述。 |
|
|
customProperties
|
customProperties | object |
此實體的自訂屬性。 允許的索引鍵長度上限為 64 個字元,允許的值長度上限為 256 個字元,允許的項目計數為 10。 |
傳回
定義
DiarizationProperties
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
講者
|
speakers | DiarizationSpeakersProperties |
DiarizationSpeakers屬性
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
minCount
|
minCount | integer |
用於日記化的最小發言者數量的提示。 必須小於或等於 maxSpeakers 屬性。 |
|
maxCount
|
maxCount | integer |
用於分發的說話者數目上限。 必須小於 36,且大於或等於 minSpeakers 屬性。 |
檔案
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
類型
|
kind | FileKind |
資料類型。 |
|
links
|
links | FileLinks | |
|
createdDateTime
|
createdDateTime | date-time |
此檔案的建立時間。時間戳記編碼為 ISO 8601 日期和時間格式(請參閱 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations)。 |
|
properties
|
properties | FileProperties | |
|
名稱
|
name | string |
此檔案的名稱。 |
檔案種類
檔案連結
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
內容網址
|
contentUrl | uri |
擷取此檔案內容的 URL。 |
檔案屬性
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
size
|
size | integer |
資料的大小 (以位元組為單位)。 |
|
duration
|
duration | string |
如果此文件是音頻文件,則持續時間。 持續時間編碼為 ISO 8601duration (“PnYnMnDTnHnMnS”,請參閱 https://en.wikipedia.org/wiki/ISO_8601#Durations)。 |
LanguageIdentificationProperties
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
candidateLocales
|
candidateLocales | array of string |
語言識別的候選地區設定 (範例 [“en-US”, “de-DE”, “es-ES”])。 支援最少 2 個和最多 10 個候選地區設定,包括轉錄的主要地區設定。 |
|
語音模型對應
|
speechModelMapping | object |
地區設定與語音模型實體的選擇性對應。 如果未為地區設定提供任何模型,則會使用預設基本模型。索引鍵必須是候選地區設定中包含的地區設定,值是個別地區設定模型的實體。 |
分頁檔案
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
values
|
values | array of File |
受傳遞查詢參數 'skip' 和 'top' 或其預設值限制的實體清單。 使用分頁並平行刪除實體逐一查看清單時,結果中會略過某些實體。建議在用戶端上建置清單,並在擷取完整清單後刪除。 |
|
@nextLink
|
@nextLink | uri |
如果有更多可用的實體,則指向下一組編頁結果的連結;否則為 null。 |
PaginatedTranscriptions
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
values
|
values | array of Transcription |
受傳遞查詢參數 'skip' 和 'top' 或其預設值限制的實體清單。 使用分頁並平行刪除實體逐一查看清單時,結果中會略過某些實體。建議在用戶端上建置清單,並在擷取完整清單後刪除。 |
|
@nextLink
|
@nextLink | uri |
如果有更多可用的實體,則指向下一組編頁結果的連結;否則為 null。 |
褻瀆篩選模式
標點符號模式
轉錄
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
內容網址
|
contentUrls | array of uri |
您可以提供內容 URL 清單,以取得要轉錄的音訊檔案。 最多允許 1000 個 URL。此屬性不會在回應中傳回。 |
|
contentContainerUrl
|
contentContainerUrl | uri |
或者,您可以提供包含音訊檔案之 Azure Blob 容器的 URL。 容器的大小上限為 5GB,Blob 數目上限為 10000 個。Blob 的大小上限為 2.5GB。容器 SAS 應該包含 'r' (讀取) 和 'l' (清單) 許可權。此屬性不會在回應中傳回。 |
|
地區設定
|
locale | string |
所包含資料的地區設定。 如果使用語言識別,則此語言環境用於轉錄無法偵測到任何語言的語音。 |
|
顯示名稱
|
displayName | string |
物件的顯示名稱。 |
|
型號
|
model.self | uri |
參考實體的位置。 |
|
properties
|
properties | TranscriptionProperties |
轉錄屬性
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
diarization已啟用
|
diarizationEnabled | boolean |
指出是否要求分化 (說話者識別) 的值。 預設值為 |
|
wordLevelTimestamps已啟用
|
wordLevelTimestampsEnabled | boolean |
指出是否要求單字層次時間戳記的值。 預設值為 |
|
displayFormWordLevelTimestamps已啟用
|
displayFormWordLevelTimestampsEnabled | boolean |
指出是否要求顯示表單的單字層級時間戳記的值。 預設值是 |
|
通道
|
channels | array of integer |
所要求通道號碼的集合。在預設情況下,會考慮通道 0 和 1。 |
|
目的地容器網址
|
destinationContainerUrl | uri |
請求的目的地容器。### 備註 ###When 將目的地容器與 結合 |
|
標點符號模式
|
punctuationMode | PunctuationMode |
用於標點符號的模式。 |
|
褻瀆篩選模式
|
profanityFilterMode | ProfanityFilterMode |
褻瀆過濾的模式。 |
|
timeToLive
|
timeToLive | string |
轉錄完成後將在系統中保留多長時間。 一旦轉錄達到完成後的存留時間(成功或失敗),它將被自動刪除。 不設定此值或將其設定為 0 將停用自動刪除。 支援的最長持續時間為 31 天。持續時間編碼為 ISO 8601 持續時間 (“PnYnMnDTnHnMnS”,請參閱 https://en.wikipedia.org/wiki/ISO_8601#Durations)。 |
|
日記化
|
diarization | DiarizationProperties | |
|
語言識別 -
|
languageIdentification | LanguageIdentificationProperties | |
|
電子郵件
|
string |
作業完成時要傳送電子郵件通知的電子郵件地址。成功發送電子郵件後,該值將被刪除。 |