Freigeben über


Computer Vision-API

Extrahieren Sie umfangreiche Informationen aus Bildern, um visuelle Daten zu kategorisieren und zu verarbeiten, und schützen Sie Ihre Benutzer vor unerwünschten Inhalten mit diesem Azure Cognitive Service.

Dieser Connector ist in den folgenden Produkten und Regionen verfügbar:

Dienstleistung Class Regions
Copilot Studio Norm Alle Power Automate-Regionen
Logik-Apps Norm Alle Logik-Apps-Regionen
Power Apps Norm Alle Power Apps-Regionen
Power Automate Norm Alle Power Automate-Regionen
Kontakt
Name Microsoft
URL Microsoft LogicApps-Unterstützung
Microsoft Power Automate-Support
Microsoft Power Apps-Unterstützung
Connectormetadaten
Herausgeber Microsoft
Webseite https://azure.microsoft.com/services/cognitive-services/computer-vision/

Um diese Integration zu verwenden, benötigen Sie eine Cognitive Service-Ressource im Azure-Portal. Sie erhalten einen Endpunkt und einen Schlüssel für die Authentifizierung Ihrer Anwendungen. Um eine Verbindung herzustellen, geben Sie den Kontoschlüssel, die Website-URL an, und wählen Sie " Verbindung erstellen" aus. Weitere Informationen zu Betriebskosten für Ihre Verbindung finden Sie hier.

Sie können jetzt mit der Verwendung dieser Integration beginnen.

Bekannte Probleme und Einschränkungen

Bitte beachten Sie, dass die Betriebsergebnisse aufgrund der zugrunde liegenden Cognitive Service Api-Natur unvollständig sein können, die auf maschinellem Lernen und Mustererkennung basiert.

Herstellen einer Verbindung mit der Microsoft Entra-ID

Um Verbindungen mit Microsoft Entra-ID zu erstellen, müssen Sie Die Rolle "Cognitive Services User" zu Ihrem Konto hinzufügen, um darauf zuzugreifen. Um diese Verbindung zu verwenden, müssen Sie die eindeutige Unterdomäne eingeben, die Ihrer Cognitive Services-Ressource zugeordnet ist, in die unterstützenden Vorgänge.

Vorgänge, die bei der Microsoft Entra ID-Authentifizierung nicht unterstützt werden

Bei Verwendung der Microsoft Entra ID-Authentifizierung werden nur V3-Aktionen unterstützt. Veraltete Aktionen funktionieren weiterhin mit Access Key der Authentifizierung, schlagen jedoch fehl, wenn sie mit einer Microsoft Entra-ID-Verbindung verwendet werden.

Erstellen einer Verbindung

Der Connector unterstützt die folgenden Authentifizierungstypen:

API-Schlüssel API-Schlüssel Alle Regionen Freigabefähig
Standard [VERALTET] Diese Option ist nur für ältere Verbindungen ohne expliziten Authentifizierungstyp vorgesehen und wird nur aus Gründen der Abwärtskompatibilität bereitgestellt. Alle Regionen Nicht teilbar

API-Schlüssel

Auth-ID: keyBasedAuth

Anwendbar: Alle Regionen

API-Schlüssel

Dies ist eine freigabefähige Verbindung. Wenn die Power-App für einen anderen Benutzer freigegeben wird, wird auch die Verbindung freigegeben. Weitere Informationen finden Sie in der Übersicht über Connectors für Canvas-Apps – Power Apps | Microsoft-Dokumente

Name Typ Description Erforderlich
Kontoschlüssel securestring Cognitive Services Account Key Richtig
Website-URL Schnur Stammwebsite-URL (Beispiel: https://westus.api.cognitive.microsoft.com)

Standard [VERALTET]

Anwendbar: Alle Regionen

Diese Option ist nur für ältere Verbindungen ohne expliziten Authentifizierungstyp vorgesehen und wird nur aus Gründen der Abwärtskompatibilität bereitgestellt.

Dies ist keine freigabefähige Verbindung. Wenn die Power-App für einen anderen Benutzer freigegeben wird, wird ein anderer Benutzer aufgefordert, eine neue Verbindung explizit zu erstellen.

Name Typ Description Erforderlich
Kontoschlüssel securestring Cognitive Services Account Key Richtig
Website-URL Schnur Stammwebsite-URL (Beispiel: https://westus.api.cognitive.microsoft.com ). Wenn nicht angegebene Website-URL standardmäßig auf 'https://westus.api.cognitive.microsoft.com' festgelegt ist.

Drosselungsgrenzwerte

Name Aufrufe Verlängerungszeitraum
API-Aufrufe pro Verbindung 1200 60 Sekunden

Aktionen

Analysieren des Bilds (V3) (Vorschau)

Dieser Vorgang extrahiert einen umfassenden Satz visueller Features basierend auf dem Bildinhalt.

Analyze Image

Dieser Vorgang extrahiert einen umfassenden Satz visueller Features basierend auf dem Bildinhalt.

Bereich des Interesses abrufen

Gibt ein umgebendes Feld um den wichtigsten Bereich des Bilds zurück.

Bereich des Interesses abrufen (V3) (Vorschau)

Gibt ein umgebendes Feld um den wichtigsten Bereich des Bilds zurück.

Beschreiben der Bild-URL

Dieser Vorgang generiert eine Beschreibung einer Bild-URL in lesbarer Sprache mit vollständigen Sätzen.

Beschreiben der Bild-URL (V3) (Vorschau)

Dieser Vorgang generiert eine Beschreibung einer Bild-URL in lesbarer Sprache mit vollständigen Sätzen.

Beschreiben des Bilds (V3) (Vorschau)

Dieser Vorgang generiert eine Beschreibung eines Bilds in lesbarer Sprache mit vollständigen Sätzen.

Beschreiben von Bildinhalten

Dieser Vorgang generiert eine Beschreibung des Bildinhalts in lesbarer Sprache mit vollständigen Sätzen.

Beschreiben von Bildinhalten (V3) (Vorschau)

Dieser Vorgang generiert eine Beschreibung des Bildinhalts in lesbarer Sprache mit vollständigen Sätzen.

Bild beschreiben

Dieser Vorgang generiert eine Beschreibung eines Bilds in lesbarer Sprache mit vollständigen Sätzen.

Bild markieren

Generiert eine Liste von Wörtern oder Tags, die für den Inhalt des bereitgestellten Bilds relevant sind.

Erkennen domänenspezifischer Inhalte

Erkennen Sie Prominente oder Sehenswürdigkeiten in einem Bild.

Erkennen von domänenspezifischen Inhalten (V3) (Vorschau)

Erkennen Sie Prominente oder Sehenswürdigkeiten in einem Bild.

Erkennen von Objekten (V3) (Vorschau)

Generiert eine Liste der abgetrennten Objekte im bereitgestellten Bild.

Miniaturansicht generieren

Dieser Vorgang generiert ein Miniaturbild mit der vom Benutzer angegebenen Breite und Höhe.

Miniaturansicht generieren (V3) (Vorschau)

Dieser Vorgang generiert ein Miniaturbild mit der vom Benutzer angegebenen Breite und Höhe.

Objekte erkennen

Generiert eine Liste der abgetrennten Objekte im bereitgestellten Bild.

Optische Zeichenerkennung (OCR) in JSON

Optische Zeichenerkennung (Optical Character Recognition, OCR) erkennt Text in einem Bild und extrahiert die erkannten Zeichen in einen computerverwendbaren JSON-Datenstrom.

Optische Zeichenerkennung (OCR) in Text

Optische Zeichenerkennung (Optical Character Recognition, OCR) erkennt Text in einem Bild und extrahiert die erkannten Zeichen in eine Textdatei.

Optische Zeichenerkennung (OCR) zu JSON (V3) (Vorschau)

Optische Zeichenerkennung (Optical Character Recognition, OCR) erkennt Text in einem Bild und extrahiert die erkannten Zeichen in einen computerverwendbaren JSON-Datenstrom.

Optische Zeichenerkennung (OCR) zu Text (V3) (Vorschau)

Optische Zeichenerkennung (Optical Character Recognition, OCR) erkennt Text in einem Bild und extrahiert die erkannten Zeichen in eine Textdatei.

Tagbild (V3) (Vorschau)

Generiert eine Liste von Wörtern oder Tags, die für den Inhalt des bereitgestellten Bilds relevant sind.

Analysieren des Bilds (V3) (Vorschau)

Dieser Vorgang extrahiert einen umfassenden Satz visueller Features basierend auf dem Bildinhalt.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Language
language string

Der Dienst gibt Erkennungsergebnisse in der angegebenen Sprache zurück.

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Analyze Image

Dieser Vorgang extrahiert einen umfassenden Satz visueller Features basierend auf dem Bildinhalt.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Language
language string

Der Dienst gibt Erkennungsergebnisse in der angegebenen Sprache zurück.

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Bereich des Interesses abrufen

Gibt ein umgebendes Feld um den wichtigsten Bereich des Bilds zurück.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Bereich des Interesses abrufen (V3) (Vorschau)

Gibt ein umgebendes Feld um den wichtigsten Bereich des Bilds zurück.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Beschreiben der Bild-URL

Dieser Vorgang generiert eine Beschreibung einer Bild-URL in lesbarer Sprache mit vollständigen Sätzen.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Max. Kandidaten
maxCandidates number

Maximale Anzahl der zurückzugebenden Kandidatenbeschreibungen.

Language
language string

Der Dienst gibt Erkennungsergebnisse in der angegebenen Sprache zurück.

Bild-URL
url url

Quelle des Bildverweises nach URL.

Gibt zurück

Beschreiben der Bild-URL (V3) (Vorschau)

Dieser Vorgang generiert eine Beschreibung einer Bild-URL in lesbarer Sprache mit vollständigen Sätzen.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Max. Kandidaten
maxCandidates number

Maximale Anzahl der zurückzugebenden Kandidatenbeschreibungen.

Language
language string

Der Dienst gibt Erkennungsergebnisse in der angegebenen Sprache zurück.

Bild-URL
url url

Quelle des Bildverweises nach URL.

Gibt zurück

Beschreiben des Bilds (V3) (Vorschau)

Dieser Vorgang generiert eine Beschreibung eines Bilds in lesbarer Sprache mit vollständigen Sätzen.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Max. Kandidaten
maxCandidates number

Maximale Anzahl der zurückzugebenden Kandidatenbeschreibungen.

Language
language string

Der Dienst gibt Erkennungsergebnisse in der angegebenen Sprache zurück.

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Beschreiben von Bildinhalten

Dieser Vorgang generiert eine Beschreibung des Bildinhalts in lesbarer Sprache mit vollständigen Sätzen.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Max. Kandidaten
maxCandidates number

Maximale Anzahl der zurückzugebenden Kandidatenbeschreibungen.

Language
language string

Der Dienst gibt Erkennungsergebnisse in der angegebenen Sprache zurück.

Bildinhalt
Image True binary

Quelle des Bildverweises im Textkörper.

Gibt zurück

Beschreiben von Bildinhalten (V3) (Vorschau)

Dieser Vorgang generiert eine Beschreibung des Bildinhalts in lesbarer Sprache mit vollständigen Sätzen.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Max. Kandidaten
maxCandidates number

Maximale Anzahl der zurückzugebenden Kandidatenbeschreibungen.

Language
language string

Der Dienst gibt Erkennungsergebnisse in der angegebenen Sprache zurück.

Bildinhalt
Image True binary

Quelle des Bildverweises im Textkörper.

Gibt zurück

Bild beschreiben

Dieser Vorgang generiert eine Beschreibung eines Bilds in lesbarer Sprache mit vollständigen Sätzen.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Max. Kandidaten
maxCandidates number

Maximale Anzahl der zurückzugebenden Kandidatenbeschreibungen.

Language
language string

Der Dienst gibt Erkennungsergebnisse in der angegebenen Sprache zurück.

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Bild markieren

Generiert eine Liste von Wörtern oder Tags, die für den Inhalt des bereitgestellten Bilds relevant sind.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Erkennen domänenspezifischer Inhalte

Erkennen Sie Prominente oder Sehenswürdigkeiten in einem Bild.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Domänenmodell
model True string

Unterstütztes domänenspezifisches Modell, das im Bild erkannt werden soll.

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Erkennen von domänenspezifischen Inhalten (V3) (Vorschau)

Erkennen Sie Prominente oder Sehenswürdigkeiten in einem Bild.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Domänenmodell
model True string

Unterstütztes domänenspezifisches Modell, das im Bild erkannt werden soll.

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Erkennen von Objekten (V3) (Vorschau)

Generiert eine Liste der abgetrennten Objekte im bereitgestellten Bild.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Miniaturansicht generieren

Dieser Vorgang generiert ein Miniaturbild mit der vom Benutzer angegebenen Breite und Höhe.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Miniaturansichtsbreite
width True number

Breite der generierten Miniaturansicht – empfohlen ist 50

Miniaturansichtshöhe
height True number

Höhe der generierten Miniaturansicht – empfohlen ist 50

Intelligentes Zuschneiden
smartCropping boolean

Boolesche Kennzeichnung zum Aktivieren des intelligenten Zuschneidens

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Generiertes Miniaturbild

Vorschauminiatur
binary

Miniaturansicht generieren (V3) (Vorschau)

Dieser Vorgang generiert ein Miniaturbild mit der vom Benutzer angegebenen Breite und Höhe.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Miniaturansichtsbreite
width True number

Breite der generierten Miniaturansicht – empfohlen ist 50

Miniaturansichtshöhe
height True number

Höhe der generierten Miniaturansicht – empfohlen ist 50

Intelligentes Zuschneiden
smartCropping boolean

Boolesche Kennzeichnung zum Aktivieren des intelligenten Zuschneidens

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Generiertes Miniaturbild

Vorschauminiatur
binary

Objekte erkennen

Generiert eine Liste der abgetrennten Objekte im bereitgestellten Bild.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Optische Zeichenerkennung (OCR) in JSON

Optische Zeichenerkennung (Optical Character Recognition, OCR) erkennt Text in einem Bild und extrahiert die erkannten Zeichen in einen computerverwendbaren JSON-Datenstrom.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

JSON-Antwort
OCRJsonResponse

Optische Zeichenerkennung (OCR) in Text

Optische Zeichenerkennung (Optical Character Recognition, OCR) erkennt Text in einem Bild und extrahiert die erkannten Zeichen in eine Textdatei.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Optische Zeichenerkennung (OCR) zu JSON (V3) (Vorschau)

Optische Zeichenerkennung (Optical Character Recognition, OCR) erkennt Text in einem Bild und extrahiert die erkannten Zeichen in einen computerverwendbaren JSON-Datenstrom.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

JSON-Antwort
OCRJsonResponse

Optische Zeichenerkennung (OCR) zu Text (V3) (Vorschau)

Optische Zeichenerkennung (Optical Character Recognition, OCR) erkennt Text in einem Bild und extrahiert die erkannten Zeichen in eine Textdatei.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Tagbild (V3) (Vorschau)

Generiert eine Liste von Wörtern oder Tags, die für den Inhalt des bereitgestellten Bilds relevant sind.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Ressourcendomäne oder Region
subdomainName True string

Azure-Unterdomäne oder geografische Region (z. B. Westus)

Bildquelle
format True string

Quelle des Bilds – entweder enthalten oder durch Referenz-URL.

Bild
Image True dynamic

Gibt zurück

Definitionen

DomainModelResponse

Name Pfad Typ Beschreibung
Berühmtheiten
result.celebrities array of object

Bekannte Prominente im Bild

Prominente Konfidenz
result.celebrities.confidence float

Konfidenzbewertung, dass das Bild von Prominenten ist

Prominenter Name
result.celebrities.name string

Name des bekannten Prominenten

Grenzsteine
result.landmarks array of object

Erkannte Sehenswürdigkeiten im Bild

Orientierungsvertrauen
result.landmarks.confidence float

Konfidenzbewertung, die von Orientierungspunkt ist

Orientierungspunktname
result.landmarks.name string

Name des identifizierten Orientierungspunkts

TagResponse

Name Pfad Typ Beschreibung
tags
tags array of object

Satz von Tags, die aus der Bildanalyse zurückgegeben werden.

Konfidenzbewertung für Kategorien
tags.confidence float

Konfidenzbewertung des identifizierten Tags.

Tagname
tags.name string

Name des identifizierten Tags.

DetectResponse

Name Pfad Typ Beschreibung
Objekte
objects array of object

Gruppe von Objekten, die aus der Bildanalyse zurückgegeben werden.

Konfidenzbewertung des Objekts
objects.confidence float

Konfidenzbewertung des identifizierten Objekts.

Objektname
objects.object string

Name des identifizierten Objekts.

AreaOfInterestResponse

OCRJsonResponse

Name Pfad Typ Beschreibung
Textsprache
language string

Die Sprache des Bildtexts wurde erkannt.

Regionsarray
regions array of object

Zurückgegebene Textbereiche.

OCRTextResponse

Name Pfad Typ Beschreibung
Erkannter Text
text string

Text, der im analysierten Bild erkannt wurde

AnalyzeResponse

Name Pfad Typ Beschreibung
categories
categories array of object

Kategorien, die aus dem Bild identifiziert wurden

Kategoriename
categories.name string

Name der kategorie, die aus dem Bild identifiziert wurde

Kategorie Konfidenzbewertung
categories.score float

Konfidenzbewertung für die Bildkategorie

Untertitel
description.captions array of object

Liste der beschriftungen, die aus dem Bild generiert wurden

Beschriftungs-Konfidenzbewertung
description.captions.confidence float

Konfidenzbewertung der Bildbeschriftung

Beschriftungstext
description.captions.text string

Aus dem Bild generierte Textbeschriftung

Tagnamen
description.tags array of string

Sammlung von Tagnamen.

tags
tags array of object

Tags, die mit Konfidenzergebnissen identifiziert wurden.

Konfidenzbewertung für Kategorien
tags.confidence float

Konfidenzbewertung für die identifizierten Tags.

Tagname
tags.name string

Name des identifizierten Tags.

DescribeResponse

Name Pfad Typ Beschreibung
Untertitel
description.captions array of object

Liste der beschriftungen, die aus dem Bild generiert wurden

Beschriftungs-Konfidenzbewertung
description.captions.confidence float

Konfidenzbewertung der Bildbeschriftung

Beschriftungstext
description.captions.text string

Aus dem Bild generierte Textbeschriftung

Tagnamen
description.tags array of string

Sammlung von Tagnamen.

binär

Dies ist der grundlegende Datentyp "binary".