共用方式為


Azure Batch 語音轉文字

準確地將音訊轉錄為 100 多種語言和變體的文字。 作為 Azure AI 語音服務的一部分,批次轉譯可讓您在儲存體中轉譯大量音訊。 您可使用共用存取簽章 (SAS) URI 來指向音訊檔案,並以非同步方式接收轉譯結果。

此連接器適用於以下產品和區域:

服務 Class Regions
副駕駛工作室 標準 除下列區域外的所有 Power Automate 區域
     - 由 21Vianet 營運的中國雲
邏輯應用程式 標準 所有 Logic Apps 區域, 但下列區域除外:
     - Azure 中國區域
Power Apps 標準 除下列區域外的所有 Power Apps 區域
     - 由 21Vianet 營運的中國雲
Power Automate(自動化服務) 標準 除下列區域外的所有 Power Automate 區域
     - 由 21Vianet 營運的中國雲
連絡人​​
名稱 語音服務 Power Platform 小組
URL https://docs.microsoft.com/azure/cognitive-services/speech-service/support
Email speechpowerplatform@microsoft.com
連接器中繼資料
Publisher Microsoft
網站 https://docs.microsoft.com/azure/cognitive-services/speech-service/
隱私策略 https://privacy.microsoft.com
類別 人工智慧;網站

語音服務批次轉錄 API 是雲端式服務,可針對提供的音訊內容提供批次語音辨識非同步處理。 此連接器會將這些函式公開為 Microsoft Power Automate 和 Power Apps 中的作業。

Pre-requisites

您將需要以下內容才能繼續:

正在建立連線

連接器支援下列驗證類型:

API 金鑰 API 金鑰 (ApiKey) 所有區域 可共用
Microsoft Entra ID 整合式 使用 Microsoft Entra ID 來存取您的語音服務。 Azure Government 和 US Government (GCC-High) 中的 Azure Government 和國防部 (DoD) 以外的所有區域 不可共享
Microsoft Entra ID 整合式 (Azure 政府) 使用 Microsoft Entra ID 來存取您的語音服務。 僅限 Azure Government 和美國政府 (GCC-High) 中的 Azure Government 和國防部 (DoD) 不可共享
預設值 [已棄用] 此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。 所有區域 不可共享

API 金鑰

驗證 ID:keyBasedAuth

適用:所有地區

API 金鑰 (ApiKey)

這是可共享的連接。 如果 Power App 與其他使用者共用,也會共用連線。 如需詳細資訊,請參閱 畫布應用程式的連接器概觀 - Power Apps |Microsoft 文件

名稱 類型 Description 為必填項目
帳戶金鑰 securestring 語音服務金鑰
區域 字串 語音服務區域 (範例:eastus)

Microsoft Entra ID 整合

驗證識別碼:tokenBasedAuth

適用:Azure Government 和美國政府 (GCC-High) 中的 Azure Government 和國防部 (DoD) 以外的所有區域

使用 Microsoft Entra ID 來存取您的語音服務。

這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。

名稱 類型 Description 為必填項目
自訂子網域 字串 自訂子網域端點 URL (範例:contoso)

Microsoft Entra ID 整合式 (Azure 政府)

驗證識別碼:tokenBasedAuth

適用:僅限 Azure Government 和美國政府 (GCC-High) 中的 Azure Government 和國防部 (DoD)

使用 Microsoft Entra ID 來存取您的語音服務。

這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。

名稱 類型 Description 為必填項目
自訂子網域 字串 自訂子網域端點 URL (範例:contoso)

預設值 [已棄用]

適用:所有地區

此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。

這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。

名稱 類型 Description 為必填項目
帳戶金鑰 securestring 適用於批次語音轉文字帳戶金鑰的 Azure 認知服務
區域 字串 語音服務區域 (範例:eastus)

節流限制

名稱 呼叫 續約期間
每個連線的 API 呼叫 100 60 秒

動作

刪除轉錄 (V3.1)

刪除指定的轉錄任務。

取得支援的地區設定 (V3.1)

取得離線轉錄支援的地區設定清單。

取得轉譯清單檔案 (V3.1)

取得指定 ID 所識別的轉錄檔案。

取得轉錄 (V3.1)

取得指定 ID 所識別的轉錄。

取得轉錄檔案 (V3.1)

從轉錄 (以 id 識別) 取得一個特定檔案 (以 fileId 識別) 。

取得轉錄清單 (V3.1)

取得已驗證訂用帳戶的轉錄清單。

建立轉錄 (V3.1)

建立新的轉錄。

更新轉錄 (V3.1)

更新其識別所識別轉錄的可變詳細資料。

刪除轉錄 (V3.1)

刪除指定的轉錄任務。

參數

名稱 機碼 必要 類型 Description
Id
id True uuid

轉錄的識別碼。

取得支援的地區設定 (V3.1)

取得離線轉錄支援的地區設定清單。

傳回

名稱 路徑 類型 Description
array of string

取得轉譯清單檔案 (V3.1)

取得指定 ID 所識別的轉錄檔案。

參數

名稱 機碼 必要 類型 Description
Id
id True uuid

轉錄的識別碼。

SAS 有效性(以秒為單位)
sasValidityInSeconds integer

SAS URL 應該有效的持續時間 (以秒為單位)。 預設持續時間為 12 小時。 使用 BYOS ()https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-encryption-of-data-at-rest#bring-your-own-storage-byos-for-customization-and-logging 時:值為 0 表示會產生沒有 SAS 權杖的純 Blob URI。

跳過
skip integer

將略過的資料集數目。

前幾個
top integer

略過後將包含的資料集數目。

Filter
filter string

用於選取可用檔案子集的篩選運算式。

  • 支援的屬性: name、createdDateTime、kind。
  • 運算子:
    - 所有內容都支援 eq、ne。
    - createDateTime 支援 GT、GE、LT、LE。
    - and, or, not 都支援。
  • 範例:filter=name eq 'myaudio.wav.json' and kind eq 'Transcription'

傳回

取得轉錄 (V3.1)

取得指定 ID 所識別的轉錄。

參數

名稱 機碼 必要 類型 Description
Id
id True uuid

轉錄的識別碼。

傳回

身體
Transcription

取得轉錄檔案 (V3.1)

從轉錄 (以 id 識別) 取得一個特定檔案 (以 fileId 識別) 。

參數

名稱 機碼 必要 類型 Description
Id
id True uuid

轉錄的識別碼。

檔案標識碼
fileId True uuid

檔案的識別碼。

SAS 有效性(以秒為單位)
sasValidityInSeconds integer

SAS URL 應該有效的持續時間 (以秒為單位)。 預設持續時間為 12 小時。 使用 BYOS ()https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-encryption-of-data-at-rest#bring-your-own-storage-byos-for-customization-and-logging 時:值為 0 表示會產生沒有 SAS 權杖的純 Blob URI。

傳回

身體
File

取得轉錄清單 (V3.1)

取得已驗證訂用帳戶的轉錄清單。

參數

名稱 機碼 必要 類型 Description
跳過
skip integer

將略過的資料集數目。

前幾個
top integer

略過後將包含的資料集數目。

Filter
filter string

用於選取可用轉錄子集的篩選運算式。

  • 支援的屬性: displayName、description、createdDateTime、lastActionDateTime、status、locale。
  • 運算子:
    - 所有內容都支援 eq、ne。
    - createDateTime 和 lastActionDateTime 支援 gt、ge、lt、le。
    - and, or, not 都支援。
  • 範例:filter=createdDateTime gt 2022-02-01T11:00:00Z

傳回

建立轉錄 (V3.1)

建立新的轉錄。

參數

名稱 機碼 必要 類型 Description
內容網址
contentUrls array of uri

您可以提供內容 URL 清單,以取得要轉錄的音訊檔案。 最多允許 1000 個 URL。此屬性不會在回應中傳回。

contentContainerUrl
contentContainerUrl uri

或者,您可以提供包含音訊檔案之 Azure Blob 容器的 URL。 容器的大小上限為 5GB,Blob 數目上限為 10000 個。Blob 的大小上限為 2.5GB。容器 SAS 應該包含 'r' (讀取) 和 'l' (清單) 許可權。此屬性不會在回應中傳回。

地區設定
locale True string

所包含資料的地區設定。 如果使用語言識別,則此語言環境用於轉錄無法偵測到任何語言的語音。

顯示名稱
displayName True string

物件的顯示名稱。

型號
self uri

參考實體的位置。

diarization已啟用
diarizationEnabled boolean

指出是否要求分化 (說話者識別) 的值。 預設值為 false。如果只有此欄位設定為 true,且未透過指定DiarizationProperties來啟用改進的分類系統,則基本分類系統最多會區分兩個說話者。 在這種情況下,不收取額外費用。 改進的分寫系統為可配置範圍的揚聲器提供分寫。 它可以在 DiarizationProperties 現場配置。 已棄用:基本分類系統已被取代,並將與下一個主要版本 API 中的設定一起diarizationEnabled 移除。

wordLevelTimestamps已啟用
wordLevelTimestampsEnabled boolean

指出是否要求單字層次時間戳記的值。 預設值為false

displayFormWordLevelTimestamps已啟用
displayFormWordLevelTimestampsEnabled boolean

指出是否要求顯示表單的單字層級時間戳記的值。 預設值是 false

通道
channels array of integer

所要求通道號碼的集合。在預設情況下,會考慮通道 0 和 1。

目的地容器網址
destinationContainerUrl uri

請求的目的地容器。### 備註 ###When 將目的地容器與 結合 timeToLive使用,轉錄的元資料會正常刪除,但儲存在目標容器中的資料,包括轉錄結果,將保持不變,因為此容器不需要刪除權限。
若要支援自動清除,請在容器上設定 Blob 存留期,或使用「自備儲存體 (BYOS)」,而不是 destinationContainerUrl,其中可以清除 Blob。

標點符號模式
punctuationMode string

用於標點符號的模式。

褻瀆篩選模式
profanityFilterMode string

褻瀆過濾的模式。

timeToLive
timeToLive string

轉錄完成後將在系統中保留多長時間。 一旦轉錄達到完成後的存留時間(成功或失敗),它將被自動刪除。 不設定此值或將其設定為 0 將停用自動刪除。 支援的最長持續時間為 31 天。持續時間編碼為 ISO 8601 持續時間 (“PnYnMnDTnHnMnS”,請參閱 https://en.wikipedia.org/wiki/ISO_8601#Durations)。

minCount
minCount integer

用於日記化的最小發言者數量的提示。 必須小於或等於 maxSpeakers 屬性。

maxCount
maxCount integer

用於分發的說話者數目上限。 必須小於 36,且大於或等於 minSpeakers 屬性。

candidateLocales
candidateLocales True array of string

語言識別的候選地區設定 (範例 [“en-US”, “de-DE”, “es-ES”])。 支援最少 2 個和最多 10 個候選地區設定,包括轉錄的主要地區設定。

語音模型對應
speechModelMapping object

地區設定與語音模型實體的選擇性對應。 如果未為地區設定提供任何模型,則會使用預設基本模型。索引鍵必須是候選地區設定中包含的地區設定,值是個別地區設定模型的實體。

電子郵件
email string

作業完成時要傳送電子郵件通知的電子郵件地址。成功發送電子郵件後,該值將被刪除。

傳回

身體
Transcription

更新轉錄 (V3.1)

更新其識別所識別轉錄的可變詳細資料。

參數

名稱 機碼 必要 類型 Description
Id
id True uuid

轉錄的識別碼。

自我
self True uri

參考實體的位置。

顯示名稱
displayName string

物件的名稱。

說明
description string

物件的描述。

customProperties
customProperties object

此實體的自訂屬性。 允許的索引鍵長度上限為 64 個字元,允許的值長度上限為 256 個字元,允許的項目計數為 10。

傳回

身體
Transcription

定義

DiarizationProperties

名稱 路徑 類型 Description
講者
speakers DiarizationSpeakersProperties

DiarizationSpeakers屬性

名稱 路徑 類型 Description
minCount
minCount integer

用於日記化的最小發言者數量的提示。 必須小於或等於 maxSpeakers 屬性。

maxCount
maxCount integer

用於分發的說話者數目上限。 必須小於 36,且大於或等於 minSpeakers 屬性。

檔案

名稱 路徑 類型 Description
類型
kind FileKind

資料類型。

links
links FileLinks
createdDateTime
createdDateTime date-time

此檔案的建立時間。時間戳記編碼為 ISO 8601 日期和時間格式(請參閱 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations)。

properties
properties FileProperties
名稱
name string

此檔案的名稱。

檔案種類

資料類型。

資料類型。

檔案連結

名稱 路徑 類型 Description
內容網址
contentUrl uri

擷取此檔案內容的 URL。

檔案屬性

名稱 路徑 類型 Description
size
size integer

資料的大小 (以位元組為單位)。

duration
duration string

如果此文件是音頻文件,則持續時間。 持續時間編碼為 ISO 8601duration (“PnYnMnDTnHnMnS”,請參閱 https://en.wikipedia.org/wiki/ISO_8601#Durations)。

LanguageIdentificationProperties

名稱 路徑 類型 Description
candidateLocales
candidateLocales array of string

語言識別的候選地區設定 (範例 [“en-US”, “de-DE”, “es-ES”])。 支援最少 2 個和最多 10 個候選地區設定,包括轉錄的主要地區設定。

語音模型對應
speechModelMapping object

地區設定與語音模型實體的選擇性對應。 如果未為地區設定提供任何模型,則會使用預設基本模型。索引鍵必須是候選地區設定中包含的地區設定,值是個別地區設定模型的實體。

分頁檔案

名稱 路徑 類型 Description
values
values array of File

受傳遞查詢參數 'skip' 和 'top' 或其預設值限制的實體清單。 使用分頁並平行刪除實體逐一查看清單時,結果中會略過某些實體。建議在用戶端上建置清單,並在擷取完整清單後刪除。

@nextLink
@nextLink uri

如果有更多可用的實體,則指向下一組編頁結果的連結;否則為 null。

PaginatedTranscriptions

名稱 路徑 類型 Description
values
values array of Transcription

受傳遞查詢參數 'skip' 和 'top' 或其預設值限制的實體清單。 使用分頁並平行刪除實體逐一查看清單時,結果中會略過某些實體。建議在用戶端上建置清單,並在擷取完整清單後刪除。

@nextLink
@nextLink uri

如果有更多可用的實體,則指向下一組編頁結果的連結;否則為 null。

褻瀆篩選模式

褻瀆過濾的模式。

褻瀆過濾的模式。

標點符號模式

用於標點符號的模式。

用於標點符號的模式。

轉錄

名稱 路徑 類型 Description
內容網址
contentUrls array of uri

您可以提供內容 URL 清單,以取得要轉錄的音訊檔案。 最多允許 1000 個 URL。此屬性不會在回應中傳回。

contentContainerUrl
contentContainerUrl uri

或者,您可以提供包含音訊檔案之 Azure Blob 容器的 URL。 容器的大小上限為 5GB,Blob 數目上限為 10000 個。Blob 的大小上限為 2.5GB。容器 SAS 應該包含 'r' (讀取) 和 'l' (清單) 許可權。此屬性不會在回應中傳回。

地區設定
locale string

所包含資料的地區設定。 如果使用語言識別,則此語言環境用於轉錄無法偵測到任何語言的語音。

顯示名稱
displayName string

物件的顯示名稱。

型號
model.self uri

參考實體的位置。

properties
properties TranscriptionProperties

轉錄屬性

名稱 路徑 類型 Description
diarization已啟用
diarizationEnabled boolean

指出是否要求分化 (說話者識別) 的值。 預設值為 false。如果只有此欄位設定為 true,且未透過指定DiarizationProperties來啟用改進的分類系統,則基本分類系統最多會區分兩個說話者。 在這種情況下,不收取額外費用。 改進的分寫系統為可配置範圍的揚聲器提供分寫。 它可以在 DiarizationProperties 現場配置。 已棄用:基本分類系統已被取代,並將與下一個主要版本 API 中的設定一起diarizationEnabled 移除。

wordLevelTimestamps已啟用
wordLevelTimestampsEnabled boolean

指出是否要求單字層次時間戳記的值。 預設值為false

displayFormWordLevelTimestamps已啟用
displayFormWordLevelTimestampsEnabled boolean

指出是否要求顯示表單的單字層級時間戳記的值。 預設值是 false

通道
channels array of integer

所要求通道號碼的集合。在預設情況下,會考慮通道 0 和 1。

目的地容器網址
destinationContainerUrl uri

請求的目的地容器。### 備註 ###When 將目的地容器與 結合 timeToLive使用,轉錄的元資料會正常刪除,但儲存在目標容器中的資料,包括轉錄結果,將保持不變,因為此容器不需要刪除權限。
若要支援自動清除,請在容器上設定 Blob 存留期,或使用「自備儲存體 (BYOS)」,而不是 destinationContainerUrl,其中可以清除 Blob。

標點符號模式
punctuationMode PunctuationMode

用於標點符號的模式。

褻瀆篩選模式
profanityFilterMode ProfanityFilterMode

褻瀆過濾的模式。

timeToLive
timeToLive string

轉錄完成後將在系統中保留多長時間。 一旦轉錄達到完成後的存留時間(成功或失敗),它將被自動刪除。 不設定此值或將其設定為 0 將停用自動刪除。 支援的最長持續時間為 31 天。持續時間編碼為 ISO 8601 持續時間 (“PnYnMnDTnHnMnS”,請參閱 https://en.wikipedia.org/wiki/ISO_8601#Durations)。

日記化
diarization DiarizationProperties
語言識別 -
languageIdentification LanguageIdentificationProperties
電子郵件
email string

作業完成時要傳送電子郵件通知的電子郵件地址。成功發送電子郵件後,該值將被刪除。