Udostępnij przez


Interfejs API przetwarzania obrazów

Wyodrębnij zaawansowane informacje z obrazów, aby kategoryzować i przetwarzać dane wizualne — i chronić użytkowników przed niechcianymi zawartościami za pomocą tej usługi Azure Cognitive Service.

Ten łącznik jest dostępny w następujących produktach i regionach:

Usługa Class Regions
Copilot Studio Standard Wszystkie regiony usługi Power Automate
Logic Apps Standard Wszystkie regiony usługi Logic Apps
Power Apps Standard Wszystkie regiony usługi Power Apps
Power Automate Standard Wszystkie regiony usługi Power Automate
Kontakt
Name Microsoft
adres URL Obsługa usługi Microsoft LogicApps
Pomoc techniczna usługi Microsoft Power Automate
Obsługa usługi Microsoft Power Apps
Metadane łącznika
Publisher Microsoft
Witryna internetowa https://azure.microsoft.com/services/cognitive-services/computer-vision/

Do korzystania z tej integracji potrzebny będzie zasób usługi Cognitive Service w witrynie Azure Portal. Otrzymasz punkt końcowy i klucz do uwierzytelniania aplikacji. Aby nawiązać połączenie, podaj klucz konta, adres URL witryny i wybierz pozycję Utwórz połączenie. Aby uzyskać informacje na temat kosztów operacji w połączeniu, dowiedz się więcej tutaj.

Teraz możesz rozpocząć korzystanie z tej integracji.

Znane problemy i ograniczenia

Należy pamiętać, że wyniki operacji mogą być niekompletne ze względu na podstawowy charakter interfejsu API usługi Cognitive Service , który jest oparty na uczeniu maszynowym i rozpoznawaniu wzorców.

Nawiązywanie połączenia za pomocą identyfikatora Entra firmy Microsoft

Aby utworzyć połączenia z identyfikatorem Entra firmy Microsoft, musisz dodać rolę użytkownika usług Cognitive Services do swojego konta, aby uzyskać dostęp. Aby użyć tego połączenia, musisz wprowadzić unikatową poddomenę skojarzoną wih zasobu usług Cognitive Services do operacji pomocniczych.

Operacje nieobsługiwane przy użyciu uwierzytelniania identyfikatora Entra firmy Microsoft

W przypadku korzystania z uwierzytelniania identyfikatora Entra firmy Microsoft obsługiwane są tylko akcje v3. Przestarzałe akcje będą nadal działać z Access Key uwierzytelnianiem, ale w przypadku użycia z połączeniem Microsoft Entra ID zakończy się niepowodzeniem.

Tworzenie połączenia

Łącznik obsługuje następujące typy uwierzytelniania:

Klucz interfejsu API ApiKey Wszystkie regiony Udostępnialne
Domyślne [PRZESTARZAŁE] Ta opcja dotyczy tylko starszych połączeń bez jawnego typu uwierzytelniania i jest dostępna tylko w celu zapewnienia zgodności z poprzednimi wersjami. Wszystkie regiony Nie można udostępniać

Klucz interfejsu API

Identyfikator uwierzytelniania: keyBasedAuth

Dotyczy: wszystkie regiony

ApiKey

Jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power jest udostępniana innemu użytkownikowi, połączenie jest również udostępniane. Aby uzyskać więcej informacji, zobacz Omówienie łączników dla aplikacji kanwy — Power Apps | Microsoft Docs

Name Typ Description Wymagane
Klucz konta securestring Klucz konta usług Cognitive Services Prawda
Adres URL witryny ciąg Adres URL witryny głównej (przykład: https://westus.api.cognitive.microsoft.com)

Domyślne [PRZESTARZAŁE]

Dotyczy: wszystkie regiony

Ta opcja dotyczy tylko starszych połączeń bez jawnego typu uwierzytelniania i jest dostępna tylko w celu zapewnienia zgodności z poprzednimi wersjami.

Nie jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power zostanie udostępniona innemu użytkownikowi, zostanie wyświetlony monit o jawne utworzenie nowego połączenia.

Name Typ Description Wymagane
Klucz konta securestring Klucz konta usług Cognitive Services Prawda
Adres URL witryny ciąg Adres URL witryny głównej (przykład: https://westus.api.cognitive.microsoft.com ). Jeśli nie określono adresu URL witryny, zostanie domyślnie ustawiona wartość "https://westus.api.cognitive.microsoft.com".

Limity ograniczania

Nazwa Wywołania Okres odnowienia
Wywołania interfejsu API na połączenie 1200 60 sekund

Akcje

Analizowanie obrazu (wersja 3) (wersja zapoznawcza)

Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu.

analizowanie obrazów

Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu.

Generowanie miniatury (wersja 3) (wersja zapoznawcza)

Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością.

Obraz tagu (wersja 3) (wersja zapoznawcza)

Generuje listę słów lub tagów, które są istotne dla zawartości dostarczonego obrazu.

Opis obrazu (wersja 3) (wersja zapoznawcza)

Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Opisywanie adresu URL obrazu

Ta operacja generuje opis adresu URL obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Opisywanie adresu URL obrazu (wersja 3) (wersja zapoznawcza)

Ta operacja generuje opis adresu URL obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Opisywanie zawartości obrazu

Ta operacja generuje opis zawartości obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Opisywanie zawartości obrazu (wersja 3) (wersja zapoznawcza)

Ta operacja generuje opis zawartości obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Opisz obraz

Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Optyczne rozpoznawanie znaków (OCR) do formatu JSON

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia JSON do użytku maszynowego.

Optyczne rozpoznawanie znaków (OCR) do formatu JSON (V3) (wersja zapoznawcza)

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia JSON do użytku maszynowego.

Optyczne rozpoznawanie znaków (OCR) do tekstu

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do pliku tekstowego.

Optyczne rozpoznawanie znaków (OCR) do tekstu (wersja 3) (wersja zapoznawcza)

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do pliku tekstowego.

Oznacz obraz

Generuje listę słów lub tagów, które są istotne dla zawartości dostarczonego obrazu.

Rozpoznawanie zawartości specyficznej dla domeny

Rozpoznawanie osobistości lub punktów orientacyjnych na obrazie.

Rozpoznawanie zawartości specyficznej dla domeny (wersja 3) (wersja zapoznawcza)

Rozpoznawanie osobistości lub punktów orientacyjnych na obrazie.

Uzyskiwanie obszaru zainteresowania

Zwraca pole ograniczenia wokół najważniejszego obszaru obrazu.

Uzyskiwanie obszaru zainteresowania (wersja 3) (wersja zapoznawcza)

Zwraca pole ograniczenia wokół najważniejszego obszaru obrazu.

Wygeneruj miniaturę

Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością.

Wykrywanie obiektów

Generuje listę obiektów wykrytych na podanym obrazie.

Wykrywanie obiektów (wersja 3) (wersja zapoznawcza)

Generuje listę obiektów wykrytych na podanym obrazie.

Analizowanie obrazu (wersja 3) (wersja zapoznawcza)

Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Język
language string

Usługa zwróci wyniki rozpoznawania w określonym języku.

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

analizowanie obrazów

Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu.

Parametry

Nazwa Klucz Wymagane Typ Opis
Język
language string

Usługa zwróci wyniki rozpoznawania w określonym języku.

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Generowanie miniatury (wersja 3) (wersja zapoznawcza)

Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Szerokość miniatury
width True number

Szerokość wygenerowanej miniatury — zalecana jest wartość 50

Wysokość miniatury
height True number

Wysokość wygenerowanej miniatury — zalecane jest 50

Inteligentne przycinanie
smartCropping boolean

Flaga logiczna umożliwiająca inteligentne przycinanie

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Wygenerowany obraz miniatury

Miniatura
binary

Obraz tagu (wersja 3) (wersja zapoznawcza)

Generuje listę słów lub tagów, które są istotne dla zawartości dostarczonego obrazu.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Opis obrazu (wersja 3) (wersja zapoznawcza)

Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Maksymalna liczba kandydatów
maxCandidates number

Maksymalna liczba opisów kandydatów do zwrócenia.

Język
language string

Usługa zwróci wyniki rozpoznawania w określonym języku.

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Opisywanie adresu URL obrazu

Ta operacja generuje opis adresu URL obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Parametry

Nazwa Klucz Wymagane Typ Opis
Maksymalna liczba kandydatów
maxCandidates number

Maksymalna liczba opisów kandydatów do zwrócenia.

Język
language string

Usługa zwróci wyniki rozpoznawania w określonym języku.

Adres URL obrazu
url url

Źródło odwołania do obrazu według adresu URL.

Zwraca

Opisywanie adresu URL obrazu (wersja 3) (wersja zapoznawcza)

Ta operacja generuje opis adresu URL obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Maksymalna liczba kandydatów
maxCandidates number

Maksymalna liczba opisów kandydatów do zwrócenia.

Język
language string

Usługa zwróci wyniki rozpoznawania w określonym języku.

Adres URL obrazu
url url

Źródło odwołania do obrazu według adresu URL.

Zwraca

Opisywanie zawartości obrazu

Ta operacja generuje opis zawartości obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Parametry

Nazwa Klucz Wymagane Typ Opis
Maksymalna liczba kandydatów
maxCandidates number

Maksymalna liczba opisów kandydatów do zwrócenia.

Język
language string

Usługa zwróci wyniki rozpoznawania w określonym języku.

Zawartość obrazu
Image True binary

Źródło odwołania do obrazu w treści.

Zwraca

Opisywanie zawartości obrazu (wersja 3) (wersja zapoznawcza)

Ta operacja generuje opis zawartości obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Maksymalna liczba kandydatów
maxCandidates number

Maksymalna liczba opisów kandydatów do zwrócenia.

Język
language string

Usługa zwróci wyniki rozpoznawania w określonym języku.

Zawartość obrazu
Image True binary

Źródło odwołania do obrazu w treści.

Zwraca

Opisz obraz

Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami.

Parametry

Nazwa Klucz Wymagane Typ Opis
Maksymalna liczba kandydatów
maxCandidates number

Maksymalna liczba opisów kandydatów do zwrócenia.

Język
language string

Usługa zwróci wyniki rozpoznawania w określonym języku.

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Optyczne rozpoznawanie znaków (OCR) do formatu JSON

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia JSON do użytku maszynowego.

Parametry

Nazwa Klucz Wymagane Typ Opis
Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Odpowiedź w formacie JSON
OCRJsonResponse

Optyczne rozpoznawanie znaków (OCR) do formatu JSON (V3) (wersja zapoznawcza)

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia JSON do użytku maszynowego.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Odpowiedź w formacie JSON
OCRJsonResponse

Optyczne rozpoznawanie znaków (OCR) do tekstu

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do pliku tekstowego.

Parametry

Nazwa Klucz Wymagane Typ Opis
Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Optyczne rozpoznawanie znaków (OCR) do tekstu (wersja 3) (wersja zapoznawcza)

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do pliku tekstowego.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Oznacz obraz

Generuje listę słów lub tagów, które są istotne dla zawartości dostarczonego obrazu.

Parametry

Nazwa Klucz Wymagane Typ Opis
Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Rozpoznawanie zawartości specyficznej dla domeny

Rozpoznawanie osobistości lub punktów orientacyjnych na obrazie.

Parametry

Nazwa Klucz Wymagane Typ Opis
Model domeny
model True string

Obsługiwany model specyficzny dla domeny do rozpoznawania na obrazie.

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Rozpoznawanie zawartości specyficznej dla domeny (wersja 3) (wersja zapoznawcza)

Rozpoznawanie osobistości lub punktów orientacyjnych na obrazie.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Model domeny
model True string

Obsługiwany model specyficzny dla domeny do rozpoznawania na obrazie.

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Uzyskiwanie obszaru zainteresowania

Zwraca pole ograniczenia wokół najważniejszego obszaru obrazu.

Parametry

Nazwa Klucz Wymagane Typ Opis
Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Uzyskiwanie obszaru zainteresowania (wersja 3) (wersja zapoznawcza)

Zwraca pole ograniczenia wokół najważniejszego obszaru obrazu.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Wygeneruj miniaturę

Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością.

Parametry

Nazwa Klucz Wymagane Typ Opis
Szerokość miniatury
width True number

Szerokość wygenerowanej miniatury — zalecana jest wartość 50

Wysokość miniatury
height True number

Wysokość wygenerowanej miniatury — zalecane jest 50

Inteligentne przycinanie
smartCropping boolean

Flaga logiczna umożliwiająca inteligentne przycinanie

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Wygenerowany obraz miniatury

Miniatura
binary

Wykrywanie obiektów

Generuje listę obiektów wykrytych na podanym obrazie.

Parametry

Nazwa Klucz Wymagane Typ Opis
Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Wykrywanie obiektów (wersja 3) (wersja zapoznawcza)

Generuje listę obiektów wykrytych na podanym obrazie.

Parametry

Nazwa Klucz Wymagane Typ Opis
Poddomena zasobów lub region
subdomainName True string

Poddomena platformy Azure lub region geograficzny (np. westus)

Źródło obrazu
format True string

Źródło obrazu — dołączone lub według adresu URL odwołania.

obraz
Image True dynamic

Zwraca

Definicje

DomainModelResponse

Nazwa Ścieżka Typ Opis
Gwiazdy
result.celebrities array of object

Rozpoznane gwiazdy na obrazie

Pewność siebie osobistości
result.celebrities.confidence float

Wskaźnik ufności, że obraz jest gwiazdą

Nazwa osobistości
result.celebrities.name string

Nazwa rozpoznanej gwiazdy

Zabytki
result.landmarks array of object

Rozpoznane punkty orientacyjne na obrazie

Pewność punktów orientacyjnych
result.landmarks.confidence float

Wskaźnik ufności przedstawiający obraz przedstawiający punkt orientacyjny

Nazwa charakterystycznego elementu
result.landmarks.name string

Nazwa zidentyfikowanego charakterystycznego elementu krajobrazu

TagResponse

Nazwa Ścieżka Typ Opis
tags
tags array of object

Zestaw tagów zwróconych z analizy obrazu.

Wskaźnik ufności tagu
tags.confidence float

Wskaźnik ufności zidentyfikowanego tagu.

Nazwa tagu
tags.name string

Nazwa zidentyfikowanego tagu.

DetectResponse

Nazwa Ścieżka Typ Opis
Obiektów
objects array of object

Zestaw obiektów zwróconych z analizy obrazu.

Wynik ufności obiektu
objects.confidence float

Wskaźnik ufności zidentyfikowanego obiektu.

Nazwa obiektu
objects.object string

Nazwa zidentyfikowanego obiektu.

AreaOfInterestResponse

OCRJsonResponse

Nazwa Ścieżka Typ Opis
Język tekstu
language string

Wykryto język tekstu obrazu.

Tablica regionów
regions array of object

Zwrócone regiony tekstowe.

OCRTextResponse

Nazwa Ścieżka Typ Opis
Wykryty tekst
text string

Tekst wykryty na przeanalizowanym obrazie

AnalyzeResponse

Nazwa Ścieżka Typ Opis
categories
categories array of object

Kategorie zidentyfikowane na podstawie obrazu

Nazwa kategorii
categories.name string

Nazwa kategorii zidentyfikowanej na podstawie obrazu

Współczynnik ufności kategorii
categories.score float

Wskaźnik ufności dla kategorii obrazów

Transkrypcje
description.captions array of object

Lista podpisów wygenerowanych na podstawie obrazu

Wskaźnik ufności podpisów
description.captions.confidence float

Wskaźnik ufności podpisu obrazu

Tekst podpisu
description.captions.text string

Podpis tekstowy wygenerowany na podstawie obrazu

Nazwy tagów
description.tags array of string

Kolekcja nazw tagów.

tags
tags array of object

Tagi identyfikowane z wynikami ufności.

Wskaźnik ufności tagu
tags.confidence float

Wskaźnik ufności dla zidentyfikowanych tagów.

Nazwa tagu
tags.name string

Nazwa zidentyfikowanego tagu.

DescribeResponse

Nazwa Ścieżka Typ Opis
Transkrypcje
description.captions array of object

Lista podpisów wygenerowanych na podstawie obrazu

Wskaźnik ufności podpisów
description.captions.confidence float

Wskaźnik ufności podpisu obrazu

Tekst podpisu
description.captions.text string

Podpis tekstowy wygenerowany na podstawie obrazu

Nazwy tagów
description.tags array of string

Kolekcja nazw tagów.

binarny

Jest to podstawowy typ danych "binary".