Compartir a través de


Computer Vision API

Extraiga información enriquecida de imágenes para clasificar y procesar datos visuales, y proteja a los usuarios del contenido no deseado con este servicio Azure Cognitive Service.

Este conector está disponible en los siguientes productos y regiones:

Service Class Regions
Copilot Studio Estándar Todas las regiones Power Automate
Aplicaciones lógicas Estándar Todas las regiones de Logic Apps
Power Apps Estándar Todas las regiones de Power Apps
Power Automate Estándar Todas las regiones Power Automate
Contacto
Nombre Microsoft
URL Compatibilidad con Microsoft LogicApps
Soporte técnico de Microsoft Power Automate
Soporte técnico de Microsoft Power Apps
Metadatos del conector
Publicador Microsoft
Sitio web https://azure.microsoft.com/services/cognitive-services/computer-vision/

Para usar esta integración, necesitará un recurso de Cognitive Service en Azure Portal. Obtendrá un punto de conexión y una clave para autenticar las aplicaciones. Para establecer una conexión, proporcione la clave de cuenta, la dirección URL del sitio y seleccione Crear conexión. Para los costos de operación en la conexión, obtenga más información aquí.

Ya está listo para empezar a usar esta integración.

Problemas y limitaciones conocidos

Tenga en cuenta que los resultados de la operación pueden estar incompletos debido a la naturaleza subyacente de Cognitive Service Api , que se basa en el aprendizaje automático y el reconocimiento de patrones.

Conexión con el identificador de Entra de Microsoft

Para crear conexiones con el identificador de Entra de Microsoft, debe agregar el rol de usuario de Cognitive Services a su cuenta para acceder. Para usar esta conexión, debe escribir el subdominio único asociado wih el recurso de Cognitive Services en las operaciones auxiliares.

Operaciones no compatibles con la autenticación de Id. de Microsoft Entra

Cuando se usa la autenticación de id. de Microsoft Entra , solo se admiten las acciones V3. Las acciones en desuso seguirán funcionando con Access Key la autenticación, pero se producirá un error si se usa con una conexión de Id. de Entra de Microsoft.

Creación de una conexión

El conector admite los siguientes tipos de autenticación:

Clave de API ApiKey Todas las regiones Compartible
Valor predeterminado [EN DESUSO] Esta opción solo es para conexiones anteriores sin un tipo de autenticación explícito y solo se proporciona para la compatibilidad con versiones anteriores. Todas las regiones No se puede compartir

Clave de API

Identificador de autenticación: keyBasedAuth

Aplicable: Todas las regiones

ApiKey

Se trata de una conexión que se puede compartir. Si la aplicación de energía se comparte con otro usuario, también se comparte la conexión. Para más información, consulte introducción a los conectores para aplicaciones de lienzo: Power Apps | Microsoft Docs

Nombre Tipo Description Obligatorio
Clave de cuenta securestring Clave de cuenta de Cognitive Services Cierto
Dirección URL del sitio cuerda / cadena Dirección URL del sitio raíz (ejemplo: https://westus.api.cognitive.microsoft.com)

Valor predeterminado [EN DESUSO]

Aplicable: Todas las regiones

Esta opción solo es para conexiones anteriores sin un tipo de autenticación explícito y solo se proporciona para la compatibilidad con versiones anteriores.

Esta conexión no se puede compartir. Si la aplicación de energía se comparte con otro usuario, se pedirá a otro usuario que cree explícitamente una nueva conexión.

Nombre Tipo Description Obligatorio
Clave de cuenta securestring Clave de cuenta de Cognitive Services Cierto
Dirección URL del sitio cuerda / cadena Dirección URL del sitio raíz (ejemplo: https://westus.api.cognitive.microsoft.com ). Si no se especifica la dirección URL del sitio, el valor predeterminado es "https://westus.api.cognitive.microsoft.com".

Limitaciones

Nombre Llamadas Período de renovación
Llamadas API por conexión 1200 60 segundos

Acciones

Analizar imagen (V3) (versión preliminar)

Esta operación extrae un amplio conjunto de características visuales basadas en el contenido de la imagen.

Analyze Image

Esta operación extrae un amplio conjunto de características visuales basadas en el contenido de la imagen.

Describir imagen

Esta operación genera una descripción de una imagen en lenguaje legible humano con oraciones completas.

Describir imagen (V3) (versión preliminar)

Esta operación genera una descripción de una imagen en lenguaje legible humano con oraciones completas.

Descripción de la dirección URL de la imagen

Esta operación genera una descripción de una dirección URL de imagen en lenguaje legible humano con oraciones completas.

Descripción de la dirección URL de la imagen (V3) (versión preliminar)

Esta operación genera una descripción de una dirección URL de imagen en lenguaje legible humano con oraciones completas.

Descripción del contenido de la imagen

Esta operación genera una descripción del contenido de la imagen en lenguaje legible humano con oraciones completas.

Descripción del contenido de la imagen (V3) (versión preliminar)

Esta operación genera una descripción del contenido de la imagen en lenguaje legible humano con oraciones completas.

Detectar objetos

Genera una lista de objetos detecdos en la imagen proporcionada.

Detectar objetos (V3) (versión preliminar)

Genera una lista de objetos detecdos en la imagen proporcionada.

Generar miniatura

Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario.

Generar miniatura (V3) (versión preliminar)

Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario.

Imagen de etiqueta (V3) (versión preliminar)

Genera una lista de palabras o etiquetas que son relevantes para el contenido de la imagen proporcionada.

Imagen de la etiqueta

Genera una lista de palabras o etiquetas que son relevantes para el contenido de la imagen proporcionada.

Obtener área de interés

Devuelve un rectángulo de selección alrededor del área más importante de la imagen.

Obtener área de interés (V3) (versión preliminar)

Devuelve un rectángulo de selección alrededor del área más importante de la imagen.

Reconocer contenido específico del dominio

Reconocer celebridades o puntos de referencia en una imagen.

Reconocimiento de contenido específico del dominio (V3) (versión preliminar)

Reconocer celebridades o puntos de referencia en una imagen.

Reconocimiento óptico de caracteres (OCR) a JSON (V3) (versión preliminar)

Reconocimiento óptico de caracteres (OCR) detecta texto en una imagen y extrae los caracteres reconocidos en una secuencia JSON utilizable por la máquina.

Reconocimiento óptico de caracteres (OCR) a texto (V3) (versión preliminar)

Reconocimiento óptico de caracteres (OCR) detecta texto en una imagen y extrae los caracteres reconocidos en un archivo de texto.

Reconocimiento óptico de caracteres (OCR) en JSON

Reconocimiento óptico de caracteres (OCR) detecta texto en una imagen y extrae los caracteres reconocidos en una secuencia JSON utilizable por la máquina.

Reconocimiento óptico de caracteres (OCR) en texto

Reconocimiento óptico de caracteres (OCR) detecta texto en una imagen y extrae los caracteres reconocidos en un archivo de texto.

Analizar imagen (V3) (versión preliminar)

Esta operación extrae un amplio conjunto de características visuales basadas en el contenido de la imagen.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Language
language string

El servicio devolverá resultados de reconocimiento en el idioma especificado.

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Analyze Image

Esta operación extrae un amplio conjunto de características visuales basadas en el contenido de la imagen.

Parámetros

Nombre Clave Requerido Tipo Description
Language
language string

El servicio devolverá resultados de reconocimiento en el idioma especificado.

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Describir imagen

Esta operación genera una descripción de una imagen en lenguaje legible humano con oraciones completas.

Parámetros

Nombre Clave Requerido Tipo Description
Número máximo de candidatos
maxCandidates number

Número máximo de descripciones candidatas que se van a devolver.

Language
language string

El servicio devolverá resultados de reconocimiento en el idioma especificado.

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Describir imagen (V3) (versión preliminar)

Esta operación genera una descripción de una imagen en lenguaje legible humano con oraciones completas.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Número máximo de candidatos
maxCandidates number

Número máximo de descripciones candidatas que se van a devolver.

Language
language string

El servicio devolverá resultados de reconocimiento en el idioma especificado.

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Descripción de la dirección URL de la imagen

Esta operación genera una descripción de una dirección URL de imagen en lenguaje legible humano con oraciones completas.

Parámetros

Nombre Clave Requerido Tipo Description
Número máximo de candidatos
maxCandidates number

Número máximo de descripciones candidatas que se van a devolver.

Language
language string

El servicio devolverá resultados de reconocimiento en el idioma especificado.

URL de imagen
url url

Origen de referencia de imagen por dirección URL.

Devoluciones

Descripción de la dirección URL de la imagen (V3) (versión preliminar)

Esta operación genera una descripción de una dirección URL de imagen en lenguaje legible humano con oraciones completas.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Número máximo de candidatos
maxCandidates number

Número máximo de descripciones candidatas que se van a devolver.

Language
language string

El servicio devolverá resultados de reconocimiento en el idioma especificado.

URL de imagen
url url

Origen de referencia de imagen por dirección URL.

Devoluciones

Descripción del contenido de la imagen

Esta operación genera una descripción del contenido de la imagen en lenguaje legible humano con oraciones completas.

Parámetros

Nombre Clave Requerido Tipo Description
Número máximo de candidatos
maxCandidates number

Número máximo de descripciones candidatas que se van a devolver.

Language
language string

El servicio devolverá resultados de reconocimiento en el idioma especificado.

Contenido de la imagen
Image True binary

Origen de la referencia de imagen en el cuerpo.

Devoluciones

Descripción del contenido de la imagen (V3) (versión preliminar)

Esta operación genera una descripción del contenido de la imagen en lenguaje legible humano con oraciones completas.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Número máximo de candidatos
maxCandidates number

Número máximo de descripciones candidatas que se van a devolver.

Language
language string

El servicio devolverá resultados de reconocimiento en el idioma especificado.

Contenido de la imagen
Image True binary

Origen de la referencia de imagen en el cuerpo.

Devoluciones

Detectar objetos

Genera una lista de objetos detecdos en la imagen proporcionada.

Parámetros

Nombre Clave Requerido Tipo Description
Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Detectar objetos (V3) (versión preliminar)

Genera una lista de objetos detecdos en la imagen proporcionada.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Generar miniatura

Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario.

Parámetros

Nombre Clave Requerido Tipo Description
Ancho de miniatura
width True number

Ancho de la miniatura generada: se recomienda 50

Alto de miniatura
height True number

Alto de la miniatura generada: se recomienda 50

Recorte inteligente
smartCropping boolean

Marca booleana para habilitar el recorte inteligente

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Imagen en miniatura generada

Miniatura
binary

Generar miniatura (V3) (versión preliminar)

Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Ancho de miniatura
width True number

Ancho de la miniatura generada: se recomienda 50

Alto de miniatura
height True number

Alto de la miniatura generada: se recomienda 50

Recorte inteligente
smartCropping boolean

Marca booleana para habilitar el recorte inteligente

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Imagen en miniatura generada

Miniatura
binary

Imagen de etiqueta (V3) (versión preliminar)

Genera una lista de palabras o etiquetas que son relevantes para el contenido de la imagen proporcionada.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Imagen de la etiqueta

Genera una lista de palabras o etiquetas que son relevantes para el contenido de la imagen proporcionada.

Parámetros

Nombre Clave Requerido Tipo Description
Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Obtener área de interés

Devuelve un rectángulo de selección alrededor del área más importante de la imagen.

Parámetros

Nombre Clave Requerido Tipo Description
Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Obtener área de interés (V3) (versión preliminar)

Devuelve un rectángulo de selección alrededor del área más importante de la imagen.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Reconocer contenido específico del dominio

Reconocer celebridades o puntos de referencia en una imagen.

Parámetros

Nombre Clave Requerido Tipo Description
Modelo de dominio
model True string

Modelo específico del dominio admitido para reconocer en la imagen.

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Reconocimiento de contenido específico del dominio (V3) (versión preliminar)

Reconocer celebridades o puntos de referencia en una imagen.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Modelo de dominio
model True string

Modelo específico del dominio admitido para reconocer en la imagen.

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Reconocimiento óptico de caracteres (OCR) a JSON (V3) (versión preliminar)

Reconocimiento óptico de caracteres (OCR) detecta texto en una imagen y extrae los caracteres reconocidos en una secuencia JSON utilizable por la máquina.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Respuesta JSON
OCRJsonResponse

Reconocimiento óptico de caracteres (OCR) a texto (V3) (versión preliminar)

Reconocimiento óptico de caracteres (OCR) detecta texto en una imagen y extrae los caracteres reconocidos en un archivo de texto.

Parámetros

Nombre Clave Requerido Tipo Description
Subdominio de recursos o región
subdomainName True string

Subdominio de Azure o región geográfica (por ejemplo, westus)

Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Reconocimiento óptico de caracteres (OCR) en JSON

Reconocimiento óptico de caracteres (OCR) detecta texto en una imagen y extrae los caracteres reconocidos en una secuencia JSON utilizable por la máquina.

Parámetros

Nombre Clave Requerido Tipo Description
Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Respuesta JSON
OCRJsonResponse

Reconocimiento óptico de caracteres (OCR) en texto

Reconocimiento óptico de caracteres (OCR) detecta texto en una imagen y extrae los caracteres reconocidos en un archivo de texto.

Parámetros

Nombre Clave Requerido Tipo Description
Origen de la imagen
format True string

Origen de la imagen, ya sea incluida o por dirección URL de referencia.

Imagen
Image True dynamic

Devoluciones

Definiciones

DomainModelResponse

Nombre Ruta de acceso Tipo Description
Celebridades
result.celebrities array of object

Celebridades reconocidas en la imagen

Confianza de la celebridad
result.celebrities.confidence float

Puntuación de confianza que la imagen es de celebridad

Nombre de la celebridad
result.celebrities.name string

Nombre de la celebridad reconocida

Señales
result.landmarks array of object

Puntos de referencia reconocidos en la imagen

Confianza de puntos de referencia
result.landmarks.confidence float

Puntuación de confianza que la imagen es de punto de referencia

Nombre del punto de referencia
result.landmarks.name string

Nombre del punto de referencia identificado

TagResponse

Nombre Ruta de acceso Tipo Description
tags
tags array of object

Conjunto de etiquetas devueltas desde el análisis de imágenes.

Puntuación de confianza de etiquetas
tags.confidence float

Puntuación de confianza de la etiqueta identificada.

Nombre de etiqueta
tags.name string

Nombre de la etiqueta identificada.

DetectResponse

Nombre Ruta de acceso Tipo Description
Objetos
objects array of object

Conjunto de objetos devueltos por el análisis de imágenes.

Puntuación de confianza del objeto
objects.confidence float

Puntuación de confianza del objeto identificado.

Nombre del objeto
objects.object string

Nombre del objeto identificado.

AreaOfInterestResponse

OCRJsonResponse

Nombre Ruta de acceso Tipo Description
Idioma de texto
language string

Se detectó el idioma del texto de la imagen.

Matriz de regiones
regions array of object

Regiones de texto devueltas.

OCRTextResponse

Nombre Ruta de acceso Tipo Description
Texto detectado
text string

Texto detectado en la imagen analizada

AnalyzeResponse

Nombre Ruta de acceso Tipo Description
categories
categories array of object

Categorías identificadas a partir de la imagen

Nombre de categoría
categories.name string

Nombre de la categoría identificada a partir de la imagen

Puntuación de confianza de categoría
categories.score float

Puntuación de confianza para la categoría de imagen

Subtítulos
description.captions array of object

Lista de subtítulos generados a partir de la imagen

Puntuación de confianza del título
description.captions.confidence float

Puntuación de confianza del título de la imagen

Texto del título
description.captions.text string

Título de texto generado a partir de la imagen

Nombres de etiqueta
description.tags array of string

Colección de nombres de etiqueta.

tags
tags array of object

Etiquetas identificadas con puntuaciones de confianza.

Puntuación de confianza de etiquetas
tags.confidence float

Puntuación de confianza para las etiquetas identificadas.

Nombre de etiqueta
tags.name string

Nombre de la etiqueta identificada.

DescribirResponse

Nombre Ruta de acceso Tipo Description
Subtítulos
description.captions array of object

Lista de subtítulos generados a partir de la imagen

Puntuación de confianza del título
description.captions.confidence float

Puntuación de confianza del título de la imagen

Texto del título
description.captions.text string

Título de texto generado a partir de la imagen

Nombres de etiqueta
description.tags array of string

Colección de nombres de etiqueta.

binary

Este es el tipo de datos básico "binary".