計算機視覺 API
從影像擷取豐富的資訊,以分類和處理視覺資料,並使用此 Azure 認知服務保護使用者免受不需要的內容的侵害。
此連接器適用於以下產品和區域:
| 服務 | Class | Regions |
|---|---|---|
| 副駕駛工作室 | 標準 | 所有 Power Automate 區域 |
| 邏輯應用程式 | 標準 | 所有 Logic Apps 區域 |
| Power Apps | 標準 | 所有 Power Apps 區域 |
| Power Automate(自動化服務) | 標準 | 所有 Power Automate 區域 |
| 連絡人 | |
|---|---|
| 名稱 | Microsoft |
| URL |
Microsoft LogicApps 支援 Microsoft Power Automate 支援 Microsoft Power Apps 支援 |
| 連接器中繼資料 | |
|---|---|
| Publisher | Microsoft |
| 網站 | https://azure.microsoft.com/services/cognitive-services/computer-vision/ |
若要使用此整合,您需要 Azure 入口網站中的 認知服務資源 。 您將獲得一個端點和一個用於驗證應用程式的金鑰。 若要建立連線,請提供帳戶金鑰、網站 URL,然後選取 建立連線。 有關連線的營運成本,請 在此處深入瞭解。
您現在已準備好開始使用此整合。
已知問題與限制
請注意,作業結果可能會因為基礎 認知服務 API 性質而不完整,而該性質是以機器學習和模式辨識為基礎。
與 Microsoft Entra ID 連線
若要建立與 Microsoft Entra ID 的連線,您必須將認知服務使用者角色新增至您的帳戶才能存取。 若要使用此連線,您必須將與認知服務資源相關聯的唯一子網域輸入支援作業。
Microsoft Entra ID 驗證不支援的作業
使用 Microsoft Entra ID 驗證時, 僅支援 V3 動作。 已取代的動作會繼續與驗證搭配 Access Key 使用, 但如果與 Microsoft Entra ID 連線搭配使用,則會失敗。
正在建立連線
連接器支援下列驗證類型:
| API 金鑰 | API 金鑰 (ApiKey) | 所有區域 | 可共用 |
| 預設值 [已棄用] | 此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。 | 所有區域 | 不可共享 |
API 金鑰
驗證 ID:keyBasedAuth
適用:所有地區
API 金鑰 (ApiKey)
這是可共享的連接。 如果 Power App 與其他使用者共用,也會共用連線。 如需詳細資訊,請參閱 畫布應用程式的連接器概觀 - Power Apps |Microsoft 文件
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 帳戶金鑰 | securestring | 認知服務帳戶金鑰 | 對 |
| 網站 URL | 字串 | 根網站網址 (範例: https://westus.api.cognitive.microsoft.com) |
預設值 [已棄用]
適用:所有地區
此選項僅適用於沒有明確驗證類型的舊連線,並且僅用於回溯相容性。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 帳戶金鑰 | securestring | 認知服務帳戶金鑰 | 對 |
| 網站 URL | 字串 | 根網站網址 (範例: https://westus.api.cognitive.microsoft.com )。如果未指定,網站網址將預設為 'https://westus.api.cognitive.microsoft.com'。 |
節流限制
| 名稱 | 呼叫 | 續約期間 |
|---|---|---|
| 每個連線的 API 呼叫 | 1200 | 60 秒 |
動作
| 偵測物件 (V3) (預覽版) |
在提供的影像中產生已偵測物件的清單。 |
| 光學字元辨識 (OCR) 至 JSON (V3) (預覽版) |
光學字元辨識 (OCR) 會偵測影像中的文字,並將辨識的字元擷取到機器可用的 JSON 串流中。 |
| 光學字元辨識 (OCR) 轉 JSON |
光學字元辨識 (OCR) 會偵測影像中的文字,並將辨識的字元擷取到機器可用的 JSON 串流中。 |
| 光學字元辨識 (OCR) 轉文字 |
光學字元辨識 (OCR) 偵測影像中的文字,並將辨識的字元擷取到文字檔案中。 |
| 光學字元辨識 (OCR) 轉文字 (V3) (預覽版) |
光學字元辨識 (OCR) 偵測影像中的文字,並將辨識的字元擷取到文字檔案中。 |
| 分析影像 |
此作業會根據影像內容擷取一組豐富的視覺特徵。 |
| 分析影像 (V3) (預覽版) |
此作業會根據影像內容擷取一組豐富的視覺特徵。 |
| 取得感興趣區域 (V3) (預覽版) |
傳回影像最重要區域周圍的邊界方塊。 |
| 描述圖像 |
此操作以人類可讀的語言生成具有完整句子的圖像描述。 |
| 描述影像 URL (v3) (預覽版) |
此作業會以人類可讀的語言產生影像 URL 的描述,其中包含完整的句子。 |
| 描述影像 (V3) (預覽) |
此操作以人類可讀的語言生成具有完整句子的圖像描述。 |
| 描述影像內容 |
此操作以人類可讀的語言生成圖像內容的描述,並帶有完整的句子。 |
| 描述影像內容 (v3) (預覽版) |
此操作以人類可讀的語言生成圖像內容的描述,並帶有完整的句子。 |
| 描述影像網址 |
此作業會以人類可讀的語言產生影像 URL 的描述,其中包含完整的句子。 |
| 標籤影像 (V3) (預覽) |
產生與所提供影像內容相關的單字或標籤清單。 |
| 標記圖像 |
產生與所提供影像內容相關的單字或標籤清單。 |
| 檢測物件 |
在提供的影像中產生已偵測物件的清單。 |
| 獲取感興趣的區域 |
傳回影像最重要區域周圍的邊界方塊。 |
| 產生縮圖 (V3) (預覽版) |
此作業會產生具有使用者指定寬度和高度的縮圖影像。 |
| 產生縮圖(Generate Thumbnail) |
此作業會產生具有使用者指定寬度和高度的縮圖影像。 |
| 識別特定領域內容 |
識別圖像中的名人或地標。 |
| 辨識網域特定內容 (v3) (預覽版) |
識別圖像中的名人或地標。 |
偵測物件 (V3) (預覽版)
在提供的影像中產生已偵測物件的清單。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
光學字元辨識 (OCR) 至 JSON (V3) (預覽版)
光學字元辨識 (OCR) 會偵測影像中的文字,並將辨識的字元擷取到機器可用的 JSON 串流中。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
- JSON 回應
- OCRJsonResponse
光學字元辨識 (OCR) 轉 JSON
光學字元辨識 (OCR) 會偵測影像中的文字,並將辨識的字元擷取到機器可用的 JSON 串流中。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
- JSON 回應
- OCRJsonResponse
光學字元辨識 (OCR) 轉文字
光學字元辨識 (OCR) 偵測影像中的文字,並將辨識的字元擷取到文字檔案中。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
光學字元辨識 (OCR) 轉文字 (V3) (預覽版)
光學字元辨識 (OCR) 偵測影像中的文字,並將辨識的字元擷取到文字檔案中。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
分析影像
此作業會根據影像內容擷取一組豐富的視覺特徵。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
語言
|
language | string |
服務會以指定的語言傳回辨識結果。 |
|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
分析影像 (V3) (預覽版)
此作業會根據影像內容擷取一組豐富的視覺特徵。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
語言
|
language | string |
服務會以指定的語言傳回辨識結果。 |
|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
取得感興趣區域 (V3) (預覽版)
傳回影像最重要區域周圍的邊界方塊。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
描述圖像
此操作以人類可讀的語言生成具有完整句子的圖像描述。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
最大候選人
|
maxCandidates | number |
要傳回的候選描述數目上限。 |
|
|
語言
|
language | string |
服務會以指定的語言傳回辨識結果。 |
|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
描述影像 URL (v3) (預覽版)
此作業會以人類可讀的語言產生影像 URL 的描述,其中包含完整的句子。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
最大候選人
|
maxCandidates | number |
要傳回的候選描述數目上限。 |
|
|
語言
|
language | string |
服務會以指定的語言傳回辨識結果。 |
|
|
圖像網址
|
url | url |
通過 URL 引用的圖像來源。 |
傳回
描述影像 (V3) (預覽)
此操作以人類可讀的語言生成具有完整句子的圖像描述。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
最大候選人
|
maxCandidates | number |
要傳回的候選描述數目上限。 |
|
|
語言
|
language | string |
服務會以指定的語言傳回辨識結果。 |
|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
描述影像內容
此操作以人類可讀的語言生成圖像內容的描述,並帶有完整的句子。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
最大候選人
|
maxCandidates | number |
要傳回的候選描述數目上限。 |
|
|
語言
|
language | string |
服務會以指定的語言傳回辨識結果。 |
|
|
圖片內容
|
Image | True | binary |
正文中圖像參考的來源。 |
傳回
描述影像內容 (v3) (預覽版)
此操作以人類可讀的語言生成圖像內容的描述,並帶有完整的句子。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
最大候選人
|
maxCandidates | number |
要傳回的候選描述數目上限。 |
|
|
語言
|
language | string |
服務會以指定的語言傳回辨識結果。 |
|
|
圖片內容
|
Image | True | binary |
正文中圖像參考的來源。 |
傳回
描述影像網址
此作業會以人類可讀的語言產生影像 URL 的描述,其中包含完整的句子。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
最大候選人
|
maxCandidates | number |
要傳回的候選描述數目上限。 |
|
|
語言
|
language | string |
服務會以指定的語言傳回辨識結果。 |
|
|
圖像網址
|
url | url |
通過 URL 引用的圖像來源。 |
傳回
標籤影像 (V3) (預覽)
產生與所提供影像內容相關的單字或標籤清單。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
- 身體
- TagResponse
標記圖像
產生與所提供影像內容相關的單字或標籤清單。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
- 身體
- TagResponse
檢測物件
在提供的影像中產生已偵測物件的清單。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
獲取感興趣的區域
傳回影像最重要區域周圍的邊界方塊。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
產生縮圖 (V3) (預覽版)
此作業會產生具有使用者指定寬度和高度的縮圖影像。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
縮圖寬度
|
width | True | number |
產生縮圖的寬度 — 建議為 50 |
|
縮圖高度
|
height | True | number |
產生縮圖的高度 - 建議為 50 |
|
智慧裁切
|
smartCropping | boolean |
啟用智慧裁切的布林旗標 |
|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
產生的縮圖影像
- 縮圖
- binary
產生縮圖(Generate Thumbnail)
此作業會產生具有使用者指定寬度和高度的縮圖影像。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
縮圖寬度
|
width | True | number |
產生縮圖的寬度 — 建議為 50 |
|
縮圖高度
|
height | True | number |
產生縮圖的高度 - 建議為 50 |
|
智慧裁切
|
smartCropping | boolean |
啟用智慧裁切的布林旗標 |
|
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
產生的縮圖影像
- 縮圖
- binary
識別特定領域內容
識別圖像中的名人或地標。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
網域模型
|
model | True | string |
支援在影像中辨識的特定領域模型。 |
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
辨識網域特定內容 (v3) (預覽版)
識別圖像中的名人或地標。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
資源子網域或區域
|
subdomainName | True | string |
Azure 子網域或地理區域 (例如 westus) |
|
網域模型
|
model | True | string |
支援在影像中辨識的特定領域模型。 |
|
圖片來源
|
format | True | string |
圖像的來源 - 包含或通過引用 url。 |
|
影像
|
Image | True | dynamic |
傳回
定義
網域模型回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
名人
|
result.celebrities | array of object |
形象中公認的名人 |
|
名人信心
|
result.celebrities.confidence | float |
對名人形象的置信度評分 |
|
名人姓名
|
result.celebrities.name | string |
公認名人的名字 |
|
地標
|
result.landmarks | array of object |
圖像中已識別的地標 |
|
地標信心
|
result.landmarks.confidence | float |
圖像具有里程碑意義的置信度分數 |
|
地標名稱
|
result.landmarks.name | string |
已識別地標的名稱 |
標籤回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
tags
|
tags | array of object |
從圖片分析傳回的標籤集。 |
|
標籤信賴度分數
|
tags.confidence | float |
已識別標籤的信賴度分數。 |
|
標記名稱
|
tags.name | string |
已識別標籤的名稱。 |
偵測回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
物件
|
objects | array of object |
從圖片分析傳回的物件集。 |
|
物件信賴度分數
|
objects.confidence | float |
已識別物件的信賴度分數。 |
|
物件名稱
|
objects.object | string |
已識別物件的名稱。 |
AreaOfInterest回應
OCRJson回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
文字語言
|
language | string |
偵測到影像文字的語言。 |
|
區域陣列
|
regions | array of object |
傳回的文字區域。 |
OCRText回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
偵測到的文字
|
text | string |
在分析的影像中偵測到的文字 |
分析回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
categories
|
categories | array of object |
從圖像中識別的類別 |
|
類別名稱
|
categories.name | string |
從影像中識別的類別名稱 |
|
類別置信度分數
|
categories.score | float |
影像類別的信賴度分數 |
|
Captions
|
description.captions | array of object |
從影像產生的標題清單 |
|
字幕置信度分數
|
description.captions.confidence | float |
影像標題的信賴度分數 |
|
標題文字
|
description.captions.text | string |
從圖像生成的文本標題 |
|
標籤名稱
|
description.tags | array of string |
標籤名稱的集合。 |
|
tags
|
tags | array of object |
使用信賴度分數識別的標籤。 |
|
標籤信賴度分數
|
tags.confidence | float |
已識別標籤的信賴度分數。 |
|
標記名稱
|
tags.name | string |
已識別標籤的名稱。 |
描述回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
Captions
|
description.captions | array of object |
從影像產生的標題清單 |
|
字幕置信度分數
|
description.captions.confidence | float |
影像標題的信賴度分數 |
|
標題文字
|
description.captions.text | string |
從圖像生成的文本標題 |
|
標籤名稱
|
description.tags | array of string |
標籤名稱的集合。 |
二進位
這是基本資料類型「二進位」。