共用方式為


計算機視覺 API

從影像擷取豐富的資訊,以分類和處理視覺資料,並使用此 Azure 認知服務保護使用者免受不需要的內容的侵害。

此連接器適用於以下產品和區域:

服務 Class Regions
副駕駛工作室 標準 所有 Power Automate 區域
邏輯應用程式 標準 所有 Logic Apps 區域
Power Apps 標準 所有 Power Apps 區域
Power Automate(自動化服務) 標準 所有 Power Automate 區域
連絡人​​
名稱 Microsoft
URL Microsoft LogicApps 支援
Microsoft Power Automate 支援
Microsoft Power Apps 支援
連接器中繼資料
Publisher Microsoft
網站 https://azure.microsoft.com/services/cognitive-services/computer-vision/

若要使用此整合,您需要 Azure 入口網站中的 認知服務資源 。 您將獲得一個端點和一個用於驗證應用程式的金鑰。 若要建立連線,請提供帳戶金鑰、網站 URL,然後選取 建立連線。 有關連線的營運成本,請 在此處深入瞭解。

您現在已準備好開始使用此整合。

已知問題與限制

請注意,作業結果可能會因為基礎 認知服務 API 性質而不完整,而該性質是以機器學習和模式辨識為基礎。

與 Microsoft Entra ID 連線

若要建立與 Microsoft Entra ID 的連線,您必須將認知服務使用者角色新增至您的帳戶才能存取。 若要使用此連線,您必須將與認知服務資源相關聯的唯一子網域輸入支援作業。

Microsoft Entra ID 驗證不支援的作業

使用 Microsoft Entra ID 驗證時, 僅支援 V3 動作。 已取代的動作會繼續與驗證搭配 Access Key 使用, 但如果與 Microsoft Entra ID 連線搭配使用,則會失敗

正在建立連線

連接器支援下列驗證類型:

API 金鑰 API 金鑰 (ApiKey) 所有區域 可共用
預設值 [已棄用] 此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。 所有區域 不可共享

API 金鑰

驗證 ID:keyBasedAuth

適用:所有地區

API 金鑰 (ApiKey)

這是可共享的連接。 如果 Power App 與其他使用者共用,也會共用連線。 如需詳細資訊,請參閱 畫布應用程式的連接器概觀 - Power Apps |Microsoft 文件

名稱 類型 Description 為必填項目
帳戶金鑰 securestring 認知服務帳戶金鑰
網站 URL 字串 根網站網址 (範例: https://westus.api.cognitive.microsoft.com

預設值 [已棄用]

適用:所有地區

此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。

這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。

名稱 類型 Description 為必填項目
帳戶金鑰 securestring 認知服務帳戶金鑰
網站 URL 字串 根網站網址 (範例: https://westus.api.cognitive.microsoft.com )。如果未指定,網站網址將預設為 'https://westus.api.cognitive.microsoft.com'。

節流限制

名稱 呼叫 續約期間
每個連線的 API 呼叫 1200 60 秒

動作

偵測物件 (V3) (預覽版)

在提供的影像中產生已偵測物件的清單。

光學字元辨識 (OCR) 至 JSON (V3) (預覽版)

光學字元辨識 (OCR) 會偵測影像中的文字,並將辨識的字元擷取到機器可用的 JSON 串流中。

光學字元辨識 (OCR) 轉 JSON

光學字元辨識 (OCR) 會偵測影像中的文字,並將辨識的字元擷取到機器可用的 JSON 串流中。

光學字元辨識 (OCR) 轉文字

光學字元辨識 (OCR) 偵測影像中的文字,並將辨識的字元擷取到文字檔案中。

光學字元辨識 (OCR) 轉文字 (V3) (預覽版)

光學字元辨識 (OCR) 偵測影像中的文字,並將辨識的字元擷取到文字檔案中。

分析影像

此作業會根據影像內容擷取一組豐富的視覺特徵。

分析影像 (V3) (預覽版)

此作業會根據影像內容擷取一組豐富的視覺特徵。

取得感興趣區域 (V3) (預覽版)

傳回影像最重要區域周圍的邊界方塊。

描述圖像

此操作以人類可讀的語言生成具有完整句子的圖像描述。

描述影像 URL (v3) (預覽版)

此作業會以人類可讀的語言產生影像 URL 的描述,其中包含完整的句子。

描述影像 (V3) (預覽)

此操作以人類可讀的語言生成具有完整句子的圖像描述。

描述影像內容

此操作以人類可讀的語言生成圖像內容的描述,並帶有完整的句子。

描述影像內容 (v3) (預覽版)

此操作以人類可讀的語言生成圖像內容的描述,並帶有完整的句子。

描述影像網址

此作業會以人類可讀的語言產生影像 URL 的描述,其中包含完整的句子。

標籤影像 (V3) (預覽)

產生與所提供影像內容相關的單字或標籤清單。

標記圖像

產生與所提供影像內容相關的單字或標籤清單。

檢測物件

在提供的影像中產生已偵測物件的清單。

獲取感興趣的區域

傳回影像最重要區域周圍的邊界方塊。

產生縮圖 (V3) (預覽版)

此作業會產生具有使用者指定寬度和高度的縮圖影像。

產生縮圖(Generate Thumbnail)

此作業會產生具有使用者指定寬度和高度的縮圖影像。

識別特定領域內容

識別圖像中的名人或地標。

辨識網域特定內容 (v3) (預覽版)

識別圖像中的名人或地標。

偵測物件 (V3) (預覽版)

在提供的影像中產生已偵測物件的清單。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

光學字元辨識 (OCR) 至 JSON (V3) (預覽版)

光學字元辨識 (OCR) 會偵測影像中的文字,並將辨識的字元擷取到機器可用的 JSON 串流中。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

JSON 回應
OCRJsonResponse

光學字元辨識 (OCR) 轉 JSON

光學字元辨識 (OCR) 會偵測影像中的文字,並將辨識的字元擷取到機器可用的 JSON 串流中。

參數

名稱 機碼 必要 類型 Description
圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

JSON 回應
OCRJsonResponse

光學字元辨識 (OCR) 轉文字

光學字元辨識 (OCR) 偵測影像中的文字,並將辨識的字元擷取到文字檔案中。

參數

名稱 機碼 必要 類型 Description
圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

光學字元辨識 (OCR) 轉文字 (V3) (預覽版)

光學字元辨識 (OCR) 偵測影像中的文字,並將辨識的字元擷取到文字檔案中。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

分析影像

此作業會根據影像內容擷取一組豐富的視覺特徵。

參數

名稱 機碼 必要 類型 Description
語言
language string

服務會以指定的語言傳回辨識結果。

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

分析影像 (V3) (預覽版)

此作業會根據影像內容擷取一組豐富的視覺特徵。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

語言
language string

服務會以指定的語言傳回辨識結果。

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

取得感興趣區域 (V3) (預覽版)

傳回影像最重要區域周圍的邊界方塊。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

描述圖像

此操作以人類可讀的語言生成具有完整句子的圖像描述。

參數

名稱 機碼 必要 類型 Description
最大候選人
maxCandidates number

要傳回的候選描述數目上限。

語言
language string

服務會以指定的語言傳回辨識結果。

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

描述影像 URL (v3) (預覽版)

此作業會以人類可讀的語言產生影像 URL 的描述,其中包含完整的句子。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

最大候選人
maxCandidates number

要傳回的候選描述數目上限。

語言
language string

服務會以指定的語言傳回辨識結果。

圖像網址
url url

通過 URL 引用的圖像來源。

傳回

描述影像 (V3) (預覽)

此操作以人類可讀的語言生成具有完整句子的圖像描述。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

最大候選人
maxCandidates number

要傳回的候選描述數目上限。

語言
language string

服務會以指定的語言傳回辨識結果。

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

描述影像內容

此操作以人類可讀的語言生成圖像內容的描述,並帶有完整的句子。

參數

名稱 機碼 必要 類型 Description
最大候選人
maxCandidates number

要傳回的候選描述數目上限。

語言
language string

服務會以指定的語言傳回辨識結果。

圖片內容
Image True binary

正文中圖像參考的來源。

傳回

描述影像內容 (v3) (預覽版)

此操作以人類可讀的語言生成圖像內容的描述,並帶有完整的句子。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

最大候選人
maxCandidates number

要傳回的候選描述數目上限。

語言
language string

服務會以指定的語言傳回辨識結果。

圖片內容
Image True binary

正文中圖像參考的來源。

傳回

描述影像網址

此作業會以人類可讀的語言產生影像 URL 的描述,其中包含完整的句子。

參數

名稱 機碼 必要 類型 Description
最大候選人
maxCandidates number

要傳回的候選描述數目上限。

語言
language string

服務會以指定的語言傳回辨識結果。

圖像網址
url url

通過 URL 引用的圖像來源。

傳回

標籤影像 (V3) (預覽)

產生與所提供影像內容相關的單字或標籤清單。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

身體
TagResponse

標記圖像

產生與所提供影像內容相關的單字或標籤清單。

參數

名稱 機碼 必要 類型 Description
圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

身體
TagResponse

檢測物件

在提供的影像中產生已偵測物件的清單。

參數

名稱 機碼 必要 類型 Description
圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

獲取感興趣的區域

傳回影像最重要區域周圍的邊界方塊。

參數

名稱 機碼 必要 類型 Description
圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

產生縮圖 (V3) (預覽版)

此作業會產生具有使用者指定寬度和高度的縮圖影像。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

縮圖寬度
width True number

產生縮圖的寬度 — 建議為 50

縮圖高度
height True number

產生縮圖的高度 - 建議為 50

智慧裁切
smartCropping boolean

啟用智慧裁切的布林旗標

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

產生的縮圖影像

縮圖
binary

產生縮圖(Generate Thumbnail)

此作業會產生具有使用者指定寬度和高度的縮圖影像。

參數

名稱 機碼 必要 類型 Description
縮圖寬度
width True number

產生縮圖的寬度 — 建議為 50

縮圖高度
height True number

產生縮圖的高度 - 建議為 50

智慧裁切
smartCropping boolean

啟用智慧裁切的布林旗標

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

產生的縮圖影像

縮圖
binary

識別特定領域內容

識別圖像中的名人或地標。

參數

名稱 機碼 必要 類型 Description
網域模型
model True string

支援在影像中辨識的特定領域模型。

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

辨識網域特定內容 (v3) (預覽版)

識別圖像中的名人或地標。

參數

名稱 機碼 必要 類型 Description
資源子網域或區域
subdomainName True string

Azure 子網域或地理區域 (例如 westus)

網域模型
model True string

支援在影像中辨識的特定領域模型。

圖片來源
format True string

圖像的來源 - 包含或通過引用 url。

影像
Image True dynamic

傳回

定義

網域模型回應

名稱 路徑 類型 Description
名人
result.celebrities array of object

形象中公認的名人

名人信心
result.celebrities.confidence float

對名人形象的置信度評分

名人姓名
result.celebrities.name string

公認名人的名字

地標
result.landmarks array of object

圖像中已識別的地標

地標信心
result.landmarks.confidence float

圖像具有里程碑意義的置信度分數

地標名稱
result.landmarks.name string

已識別地標的名稱

標籤回應

名稱 路徑 類型 Description
tags
tags array of object

從圖片分析傳回的標籤集。

標籤信賴度分數
tags.confidence float

已識別標籤的信賴度分數。

標記名稱
tags.name string

已識別標籤的名稱。

偵測回應

名稱 路徑 類型 Description
物件
objects array of object

從圖片分析傳回的物件集。

物件信賴度分數
objects.confidence float

已識別物件的信賴度分數。

物件名稱
objects.object string

已識別物件的名稱。

AreaOfInterest回應

OCRJson回應

名稱 路徑 類型 Description
文字語言
language string

偵測到影像文字的語言。

區域陣列
regions array of object

傳回的文字區域。

OCRText回應

名稱 路徑 類型 Description
偵測到的文字
text string

在分析的影像中偵測到的文字

分析回應

名稱 路徑 類型 Description
categories
categories array of object

從圖像中識別的類別

類別名稱
categories.name string

從影像中識別的類別名稱

類別置信度分數
categories.score float

影像類別的信賴度分數

Captions
description.captions array of object

從影像產生的標題清單

字幕置信度分數
description.captions.confidence float

影像標題的信賴度分數

標題文字
description.captions.text string

從圖像生成的文本標題

標籤名稱
description.tags array of string

標籤名稱的集合。

tags
tags array of object

使用信賴度分數識別的標籤。

標籤信賴度分數
tags.confidence float

已識別標籤的信賴度分數。

標記名稱
tags.name string

已識別標籤的名稱。

描述回應

名稱 路徑 類型 Description
Captions
description.captions array of object

從影像產生的標題清單

字幕置信度分數
description.captions.confidence float

影像標題的信賴度分數

標題文字
description.captions.text string

從圖像生成的文本標題

標籤名稱
description.tags array of string

標籤名稱的集合。

二進位

這是基本資料類型「二進位」。