Partager via


API Vision par ordinateur

Extrayez des informations enrichies d’images pour catégoriser et traiter les données visuelles, et protégez vos utilisateurs contre le contenu indésirable avec ce service cognitif Azure.

Ce connecteur est disponible dans les produits et régions suivants :

Service classe Régions
Copilot Studio Norme Toutes les régions Power Automate
Applications logiques Norme Toutes les régions Logic Apps
Power Apps Norme Toutes les régions Power Apps
Power Automate Norme Toutes les régions Power Automate
Contact
Nom Microsoft
URL Microsoft LogicApps Support
Prise en charge de Microsoft Power Automate
Prise en charge de Microsoft Power Apps
Métadonnées du connecteur
Éditeur Microsoft
Site internet https://azure.microsoft.com/services/cognitive-services/computer-vision/

Pour utiliser cette intégration, vous aurez besoin d’une ressource Cognitive Service dans le portail Azure. Vous obtiendrez un point de terminaison et une clé pour l’authentification de vos applications. Pour établir une connexion, indiquez la clé de compte, l’URL du site et sélectionnez Créer une connexion. Pour connaître les coûts d’opération sur votre connexion, découvrez-en plus ici.

Vous êtes maintenant prêt à commencer à utiliser cette intégration.

Problèmes connus et limitations

Notez que les résultats de l’opération peuvent être incomplets en raison de la nature sous-jacente de l’API Cognitive Service , qui est basée sur l’apprentissage automatique et la reconnaissance des modèles.

Connexion avec l’ID Microsoft Entra

Pour créer des connexions avec l’ID Microsoft Entra, vous devez ajouter le rôle d’utilisateur Cognitive Services à votre compte pour y accéder. Pour utiliser cette connexion, vous devez entrer le sous-domaine unique associé à votre ressource Cognitive Services dans les opérations de prise en charge.

Opérations non prises en charge avec l’authentification Microsoft Entra ID

Lorsque vous utilisez l’authentification Microsoft Entra ID , seules les actions V3 sont prises en charge. Les actions déconseillées continueront de fonctionner avec Access Key l’authentification, mais échoueront si elles sont utilisées avec une connexion Microsoft Entra ID.

Création d’une connexion

Le connecteur prend en charge les types d’authentification suivants :

Clé API ApiKey Toutes les régions Partageable
Valeur par défaut [DÉCONSEILLÉE] Cette option concerne uniquement les connexions plus anciennes sans type d’authentification explicite et est fournie uniquement pour la compatibilité descendante. Toutes les régions Non partageable

Clé API

ID d’authentification : keyBasedAuth

Applicable : Toutes les régions

ApiKey

Il s’agit d’une connexion partageable. Si l’application d’alimentation est partagée avec un autre utilisateur, la connexion est également partagée. Pour plus d’informations, consultez la vue d’ensemble des connecteurs pour les applications de canevas - Power Apps | Microsoft Docs

Nom Type Descriptif Obligatoire
Clé de compte securestring Clé de compte Cognitive Services Vrai
URL du site ficelle URL du site racine (exemple : https://westus.api.cognitive.microsoft.com)

Valeur par défaut [DÉCONSEILLÉE]

Applicable : Toutes les régions

Cette option concerne uniquement les connexions plus anciennes sans type d’authentification explicite et est fournie uniquement pour la compatibilité descendante.

Cette connexion n’est pas partageable. Si l’application power est partagée avec un autre utilisateur, un autre utilisateur est invité à créer une connexion explicitement.

Nom Type Descriptif Obligatoire
Clé de compte securestring Clé de compte Cognitive Services Vrai
URL du site ficelle URL du site racine (exemple : https://westus.api.cognitive.microsoft.com ). Si l’URL du site n’est pas spécifiée, la valeur «https://westus.api.cognitive.microsoft.com » est définie par défaut.

Limitations

Nom Appels Période de renouvellement
Appels d’API par connexion 1200 60 secondes

Actions

Analyser l’image (V3) (préversion)

Cette opération extrait un ensemble complet de fonctionnalités visuelles basées sur le contenu de l’image.

Analyze Image

Cette opération extrait un ensemble complet de fonctionnalités visuelles basées sur le contenu de l’image.

Décrire le contenu de l’image

Cette opération génère une description du contenu d’image dans un langage lisible par l’homme avec des phrases complètes.

Décrire le contenu d’image (V3) (préversion)

Cette opération génère une description du contenu d’image dans un langage lisible par l’homme avec des phrases complètes.

Décrire l’image

Cette opération génère une description d’une image dans un langage lisible par l’homme avec des phrases complètes.

Décrire l’image (V3) (préversion)

Cette opération génère une description d’une image dans un langage lisible par l’homme avec des phrases complètes.

Décrire l’URL de l’image

Cette opération génère une description d’une URL d’image dans un langage lisible par l’homme avec des phrases complètes.

Décrire l’URL de l’image (V3) (préversion)

Cette opération génère une description d’une URL d’image dans un langage lisible par l’homme avec des phrases complètes.

Détecter des objets

Génère une liste d’objets détectés dans l’image fournie.

Détecter des objets (V3) (préversion)

Génère une liste d’objets détectés dans l’image fournie.

Générer une miniature

Cette opération génère une image miniature avec la largeur et la hauteur spécifiées par l’utilisateur.

Générer une miniature (V3) (préversion)

Cette opération génère une image miniature avec la largeur et la hauteur spécifiées par l’utilisateur.

Image de balise

Génère une liste de mots ou de balises pertinents pour le contenu de l’image fournie.

Image de balise (V3) (préversion)

Génère une liste de mots ou de balises pertinents pour le contenu de l’image fournie.

Obtenir une zone d’intérêt

Retourne un cadre englobant autour de la zone la plus importante de l’image.

Obtenir une zone d’intérêt (V3) (préversion)

Retourne un cadre englobant autour de la zone la plus importante de l’image.

Reconnaissance optique de caractères (OCR) en texte

La reconnaissance optique de caractères (OCR) détecte le texte dans une image et extrait les caractères reconnus dans un fichier texte.

Reconnaissance optique de caractères (OCR) vers du texte (V3) (préversion)

La reconnaissance optique de caractères (OCR) détecte le texte dans une image et extrait les caractères reconnus dans un fichier texte.

Reconnaissance optique de caractères (OCR) vers JSON

La reconnaissance optique de caractères (OCR) détecte le texte d’une image et extrait les caractères reconnus dans un flux JSON utilisable par l’ordinateur.

Reconnaissance optique de caractères (OCR) vers JSON (V3) (préversion)

La reconnaissance optique de caractères (OCR) détecte le texte d’une image et extrait les caractères reconnus dans un flux JSON utilisable par l’ordinateur.

Reconnaître le contenu spécifique au domaine

Reconnaître des célébrités ou des repères dans une image.

Reconnaître le contenu spécifique au domaine (V3) (préversion)

Reconnaître des célébrités ou des repères dans une image.

Analyser l’image (V3) (préversion)

Cette opération extrait un ensemble complet de fonctionnalités visuelles basées sur le contenu de l’image.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Language
language string

Le service retourne les résultats de reconnaissance dans la langue spécifiée.

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Analyze Image

Cette opération extrait un ensemble complet de fonctionnalités visuelles basées sur le contenu de l’image.

Paramètres

Nom Clé Obligatoire Type Description
Language
language string

Le service retourne les résultats de reconnaissance dans la langue spécifiée.

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Décrire le contenu de l’image

Cette opération génère une description du contenu d’image dans un langage lisible par l’homme avec des phrases complètes.

Paramètres

Nom Clé Obligatoire Type Description
Nombre maximal de candidats
maxCandidates number

Nombre maximal de descriptions candidates à renvoyer.

Language
language string

Le service retourne les résultats de reconnaissance dans la langue spécifiée.

Contenu de l’image
Image True binary

Source de la référence d’image dans le corps.

Retours

Décrire le contenu d’image (V3) (préversion)

Cette opération génère une description du contenu d’image dans un langage lisible par l’homme avec des phrases complètes.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Nombre maximal de candidats
maxCandidates number

Nombre maximal de descriptions candidates à renvoyer.

Language
language string

Le service retourne les résultats de reconnaissance dans la langue spécifiée.

Contenu de l’image
Image True binary

Source de la référence d’image dans le corps.

Retours

Décrire l’image

Cette opération génère une description d’une image dans un langage lisible par l’homme avec des phrases complètes.

Paramètres

Nom Clé Obligatoire Type Description
Nombre maximal de candidats
maxCandidates number

Nombre maximal de descriptions candidates à renvoyer.

Language
language string

Le service retourne les résultats de reconnaissance dans la langue spécifiée.

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Décrire l’image (V3) (préversion)

Cette opération génère une description d’une image dans un langage lisible par l’homme avec des phrases complètes.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Nombre maximal de candidats
maxCandidates number

Nombre maximal de descriptions candidates à renvoyer.

Language
language string

Le service retourne les résultats de reconnaissance dans la langue spécifiée.

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Décrire l’URL de l’image

Cette opération génère une description d’une URL d’image dans un langage lisible par l’homme avec des phrases complètes.

Paramètres

Nom Clé Obligatoire Type Description
Nombre maximal de candidats
maxCandidates number

Nombre maximal de descriptions candidates à renvoyer.

Language
language string

Le service retourne les résultats de reconnaissance dans la langue spécifiée.

URL de l’image
url url

Source de référence d’image par URL.

Retours

Décrire l’URL de l’image (V3) (préversion)

Cette opération génère une description d’une URL d’image dans un langage lisible par l’homme avec des phrases complètes.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Nombre maximal de candidats
maxCandidates number

Nombre maximal de descriptions candidates à renvoyer.

Language
language string

Le service retourne les résultats de reconnaissance dans la langue spécifiée.

URL de l’image
url url

Source de référence d’image par URL.

Retours

Détecter des objets

Génère une liste d’objets détectés dans l’image fournie.

Paramètres

Nom Clé Obligatoire Type Description
Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Détecter des objets (V3) (préversion)

Génère une liste d’objets détectés dans l’image fournie.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Générer une miniature

Cette opération génère une image miniature avec la largeur et la hauteur spécifiées par l’utilisateur.

Paramètres

Nom Clé Obligatoire Type Description
Largeur des miniatures
width True number

Largeur de la miniature générée : recommandé est 50

Hauteur des miniatures
height True number

Hauteur de la miniature générée : recommandé est 50

Rognage intelligent
smartCropping boolean

Indicateur booléen pour l’activation du rognage intelligent

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Image miniature générée

Miniature
binary

Générer une miniature (V3) (préversion)

Cette opération génère une image miniature avec la largeur et la hauteur spécifiées par l’utilisateur.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Largeur des miniatures
width True number

Largeur de la miniature générée : recommandé est 50

Hauteur des miniatures
height True number

Hauteur de la miniature générée : recommandé est 50

Rognage intelligent
smartCropping boolean

Indicateur booléen pour l’activation du rognage intelligent

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Image miniature générée

Miniature
binary

Image de balise

Génère une liste de mots ou de balises pertinents pour le contenu de l’image fournie.

Paramètres

Nom Clé Obligatoire Type Description
Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Corps
TagResponse

Image de balise (V3) (préversion)

Génère une liste de mots ou de balises pertinents pour le contenu de l’image fournie.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Corps
TagResponse

Obtenir une zone d’intérêt

Retourne un cadre englobant autour de la zone la plus importante de l’image.

Paramètres

Nom Clé Obligatoire Type Description
Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Obtenir une zone d’intérêt (V3) (préversion)

Retourne un cadre englobant autour de la zone la plus importante de l’image.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Reconnaissance optique de caractères (OCR) en texte

La reconnaissance optique de caractères (OCR) détecte le texte dans une image et extrait les caractères reconnus dans un fichier texte.

Paramètres

Nom Clé Obligatoire Type Description
Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Reconnaissance optique de caractères (OCR) vers du texte (V3) (préversion)

La reconnaissance optique de caractères (OCR) détecte le texte dans une image et extrait les caractères reconnus dans un fichier texte.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Reconnaissance optique de caractères (OCR) vers JSON

La reconnaissance optique de caractères (OCR) détecte le texte d’une image et extrait les caractères reconnus dans un flux JSON utilisable par l’ordinateur.

Paramètres

Nom Clé Obligatoire Type Description
Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Réponse JSON
OCRJsonResponse

Reconnaissance optique de caractères (OCR) vers JSON (V3) (préversion)

La reconnaissance optique de caractères (OCR) détecte le texte d’une image et extrait les caractères reconnus dans un flux JSON utilisable par l’ordinateur.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Réponse JSON
OCRJsonResponse

Reconnaître le contenu spécifique au domaine

Reconnaître des célébrités ou des repères dans une image.

Paramètres

Nom Clé Obligatoire Type Description
Modèle de domaine
model True string

Modèle spécifique au domaine pris en charge pour la reconnaissance dans l’image.

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Reconnaître le contenu spécifique au domaine (V3) (préversion)

Reconnaître des célébrités ou des repères dans une image.

Paramètres

Nom Clé Obligatoire Type Description
Sous-domaine de ressource ou région
subdomainName True string

Sous-domaine Azure ou région géographique (par exemple, westus)

Modèle de domaine
model True string

Modèle spécifique au domaine pris en charge pour la reconnaissance dans l’image.

Source de l’image
format True string

Source de l’image : incluse ou par URL de référence.

Image
Image True dynamic

Retours

Définitions

DomainModelResponse

Nom Chemin d’accès Type Description
débat télévisé
result.celebrities array of object

Célébrités reconnues dans l’image

Confiance des célébrités
result.celebrities.confidence float

Score de confiance que l’image est de célébrité

Nom de la célébrité
result.celebrities.name string

Nom de la célébrité reconnue

Repères
result.landmarks array of object

Repères reconnus dans l’image

Confiance des repères
result.landmarks.confidence float

Score de confiance que l’image est de repère

Nom du repère
result.landmarks.name string

Nom du repère identifié

TagResponse

Nom Chemin d’accès Type Description
tags
tags array of object

Ensemble de balises retournées à partir de l’analyse de l’image.

Score de confiance des étiquettes
tags.confidence float

Score de confiance de la balise identifiée.

Nom de la balise
tags.name string

Nom de la balise identifiée.

DetectResponse

Nom Chemin d’accès Type Description
Objets
objects array of object

Ensemble d’objets retournés à partir de l’analyse de l’image.

Score de confiance de l’objet
objects.confidence float

Score de confiance de l’objet identifié.

Nom de l’objet
objects.object string

Nom de l’objet identifié.

AreaOfInterestResponse

OCRJsonResponse

Nom Chemin d’accès Type Description
Langue du texte
language string

Langue détectée du texte de l’image.

Tableau de régions
regions array of object

Régions de texte retournées.

OCRTextResponse

Nom Chemin d’accès Type Description
Texte détecté
text string

Texte détecté dans l’image analysée

AnalyzeResponse

Nom Chemin d’accès Type Description
categories
categories array of object

Catégories identifiées à partir de l’image

Nom de catégorie
categories.name string

Nom de la catégorie identifiée à partir de l’image

Score de confiance de catégorie
categories.score float

Score de confiance pour la catégorie d’image

Sous-titres
description.captions array of object

Liste des légendes générées à partir de l’image

Score de confiance de légende
description.captions.confidence float

Score de confiance de la légende de l’image

Texte de légende
description.captions.text string

Légende de texte générée à partir de l’image

Noms des balises
description.tags array of string

Collection de noms d’étiquettes.

tags
tags array of object

Balises identifiées avec des scores de confiance.

Score de confiance des étiquettes
tags.confidence float

Score de confiance pour les balises identifiées.

Nom de la balise
tags.name string

Nom de la balise identifiée.

DescribeResponse

Nom Chemin d’accès Type Description
Sous-titres
description.captions array of object

Liste des légendes générées à partir de l’image

Score de confiance de légende
description.captions.confidence float

Score de confiance de la légende de l’image

Texte de légende
description.captions.text string

Légende de texte générée à partir de l’image

Noms des balises
description.tags array of string

Collection de noms d’étiquettes.

binaire

Il s’agit du type de données de base "binaire".