Compartilhar via


API da Pesquisa Visual Computacional

Extraia informações avançadas de imagens para categorizar e processar dados visuais e proteger seus usuários contra conteúdo indesejado com esse Serviço Cognitivo do Azure.

Esse conector está disponível nos seguintes produtos e regiões:

Service Class Regions
Copilot Studio Standard Todas as regiões do Power Automate
Aplicativos Lógicos Standard Todas as regiões de Aplicativos Lógicos
Power Apps Standard Todas as regiões do Power Apps
Power Automate Standard Todas as regiões do Power Automate
Contato
Nome Microsoft
URL Suporte do Microsoft LogicApps
Suporte do Microsoft Power Automate
Suporte do Microsoft Power Apps
Metadados do conector
Publicador Microsoft
Site https://azure.microsoft.com/services/cognitive-services/computer-vision/

Para usar essa integração, você precisará de um recurso do Serviço Cognitivo no portal do Azure. Você obterá um ponto de extremidade e uma chave para autenticar seus aplicativos. Para fazer uma conexão, forneça a chave da conta, a URL do site e selecione Criar conexão. Para os custos de operação em sua conexão, saiba mais aqui.

Agora você está pronto para começar a usar essa integração.

Problemas e limitações conhecidos

Observe que os resultados da operação podem estar incompletos devido à natureza da API do Serviço Cognitivo subjacente, que se baseia no aprendizado de máquina e no reconhecimento de padrões.

Conectando-se à ID do Microsoft Entra

Para criar conexões com a ID do Microsoft Entra, você deve adicionar a função de Usuário dos Serviços Cognitivos à sua conta para acessar. Para usar essa conexão, você deve inserir o subdomínio exclusivo associado ao recurso dos Serviços Cognitivos nas operações de suporte.

Operações sem suporte com a autenticação da ID do Microsoft Entra

Ao usar a autenticação da ID do Microsoft Entra , há suporte apenas para ações V3. As ações preteridas continuarão a funcionar com Access Key a autenticação, mas falharão se forem usadas com uma conexão de ID do Microsoft Entra.

Criando uma conexão

O conector dá suporte aos seguintes tipos de autenticação:

Chave de API ApiKey Todas as regiões Compartilhável
Padrão [PRETERIDO] Essa opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores. Todas as regiões Não compartilhável

Chave de API

ID de autenticação: keyBasedAuth

Aplicável: todas as regiões

ApiKey

Essa é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, a conexão também será compartilhada. Para obter mais informações, consulte a visão geral dos Conectores para aplicativos de tela – Power Apps | Microsoft Docs

Nome Tipo Description Obrigatório
Chave de Conta secureString Chave de Conta dos Serviços Cognitivos Verdade
URL do site cadeia URL do site raiz (exemplo: https://westus.api.cognitive.microsoft.com)

Padrão [PRETERIDO]

Aplicável: todas as regiões

Essa opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores.

Essa não é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
Chave de Conta secureString Chave de Conta dos Serviços Cognitivos Verdade
URL do site cadeia URL do site raiz (exemplo: https://westus.api.cognitive.microsoft.com ). Se a URL do site não especificada for padronizada como 'https://westus.api.cognitive.microsoft.com'.

Limitações

Nome Chamadas Período de renovação
Chamadas à API por conexão 1200 60 segundos

Ações

Analisar imagem (V3) (versão prévia)

Essa operação extrai um conjunto avançado de recursos visuais com base no conteúdo da imagem.

Análise de Imagem

Essa operação extrai um conjunto avançado de recursos visuais com base no conteúdo da imagem.

Descrever a URL da Imagem

Essa operação gera uma descrição de uma URL de imagem em linguagem legível humana com frases completas.

Descrever a URL da Imagem (V3) (versão prévia)

Essa operação gera uma descrição de uma URL de imagem em linguagem legível humana com frases completas.

Descrever imagem

Essa operação gera uma descrição de uma imagem em linguagem legível humana com frases completas.

Descrever imagem (V3) (versão prévia)

Essa operação gera uma descrição de uma imagem em linguagem legível humana com frases completas.

Descrever o conteúdo da imagem

Essa operação gera uma descrição do conteúdo da imagem em linguagem legível humana com frases completas.

Descrever o conteúdo da imagem (V3) (versão prévia)

Essa operação gera uma descrição do conteúdo da imagem em linguagem legível humana com frases completas.

Detectar objetos

Gera uma lista de objetos detecdos na imagem fornecida.

Detectar objetos (V3) (versão prévia)

Gera uma lista de objetos detecdos na imagem fornecida.

Gerar miniatura

Essa operação gera uma imagem em miniatura com a largura e a altura especificadas pelo usuário.

Gerar miniatura (V3) (versão prévia)

Essa operação gera uma imagem em miniatura com a largura e a altura especificadas pelo usuário.

Imagem da marca (V3) (versão prévia)

Gera uma lista de palavras ou marcas relevantes para o conteúdo da imagem fornecida.

Marcar imagem

Gera uma lista de palavras ou marcas relevantes para o conteúdo da imagem fornecida.

Obter área de interesse

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Obter área de interesse (V3) (versão prévia)

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Reconhecer conteúdo específico do domínio

Reconhecer celebridades ou pontos de referência em uma imagem.

Reconhecer conteúdo específico do domínio (V3) (versão prévia)

Reconhecer celebridades ou pontos de referência em uma imagem.

Reconhecimento óptico de caracteres (OCR) para JSON

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável por computador.

Reconhecimento óptico de caracteres (OCR) para JSON (V3) (versão prévia)

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável por computador.

Reconhecimento óptico de caracteres (OCR) para texto

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Reconhecimento óptico de caracteres (OCR) para texto (V3) (versão prévia)

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Analisar imagem (V3) (versão prévia)

Essa operação extrai um conjunto avançado de recursos visuais com base no conteúdo da imagem.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Linguagem
language string

O serviço retornará os resultados de reconhecimento no idioma especificado.

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Análise de Imagem

Essa operação extrai um conjunto avançado de recursos visuais com base no conteúdo da imagem.

Parâmetros

Nome Chave Obrigatório Tipo Description
Linguagem
language string

O serviço retornará os resultados de reconhecimento no idioma especificado.

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Descrever a URL da Imagem

Essa operação gera uma descrição de uma URL de imagem em linguagem legível humana com frases completas.

Parâmetros

Nome Chave Obrigatório Tipo Description
Máximo de candidatos
maxCandidates number

Número máximo de descrições de candidatos a serem retornadas.

Linguagem
language string

O serviço retornará os resultados de reconhecimento no idioma especificado.

URL da imagem
url url

Origem da referência de imagem por URL.

Retornos

Descrever a URL da Imagem (V3) (versão prévia)

Essa operação gera uma descrição de uma URL de imagem em linguagem legível humana com frases completas.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Máximo de candidatos
maxCandidates number

Número máximo de descrições de candidatos a serem retornadas.

Linguagem
language string

O serviço retornará os resultados de reconhecimento no idioma especificado.

URL da imagem
url url

Origem da referência de imagem por URL.

Retornos

Descrever imagem

Essa operação gera uma descrição de uma imagem em linguagem legível humana com frases completas.

Parâmetros

Nome Chave Obrigatório Tipo Description
Máximo de candidatos
maxCandidates number

Número máximo de descrições de candidatos a serem retornadas.

Linguagem
language string

O serviço retornará os resultados de reconhecimento no idioma especificado.

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Descrever imagem (V3) (versão prévia)

Essa operação gera uma descrição de uma imagem em linguagem legível humana com frases completas.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Máximo de candidatos
maxCandidates number

Número máximo de descrições de candidatos a serem retornadas.

Linguagem
language string

O serviço retornará os resultados de reconhecimento no idioma especificado.

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Descrever o conteúdo da imagem

Essa operação gera uma descrição do conteúdo da imagem em linguagem legível humana com frases completas.

Parâmetros

Nome Chave Obrigatório Tipo Description
Máximo de candidatos
maxCandidates number

Número máximo de descrições de candidatos a serem retornadas.

Linguagem
language string

O serviço retornará os resultados de reconhecimento no idioma especificado.

Conteúdo da Imagem
Image True binary

Origem da referência de imagem no corpo.

Retornos

Descrever o conteúdo da imagem (V3) (versão prévia)

Essa operação gera uma descrição do conteúdo da imagem em linguagem legível humana com frases completas.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Máximo de candidatos
maxCandidates number

Número máximo de descrições de candidatos a serem retornadas.

Linguagem
language string

O serviço retornará os resultados de reconhecimento no idioma especificado.

Conteúdo da Imagem
Image True binary

Origem da referência de imagem no corpo.

Retornos

Detectar objetos

Gera uma lista de objetos detecdos na imagem fornecida.

Parâmetros

Nome Chave Obrigatório Tipo Description
Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Detectar objetos (V3) (versão prévia)

Gera uma lista de objetos detecdos na imagem fornecida.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Gerar miniatura

Essa operação gera uma imagem em miniatura com a largura e a altura especificadas pelo usuário.

Parâmetros

Nome Chave Obrigatório Tipo Description
Largura da miniatura
width True number

Largura da miniatura gerada – recomendado é 50

Altura da miniatura
height True number

Altura da miniatura gerada – recomendado é 50

Corte Inteligente
smartCropping boolean

Sinalizador booliano para habilitar o corte inteligente

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Imagem de miniatura gerada

Miniatura
binary

Gerar miniatura (V3) (versão prévia)

Essa operação gera uma imagem em miniatura com a largura e a altura especificadas pelo usuário.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Largura da miniatura
width True number

Largura da miniatura gerada – recomendado é 50

Altura da miniatura
height True number

Altura da miniatura gerada – recomendado é 50

Corte Inteligente
smartCropping boolean

Sinalizador booliano para habilitar o corte inteligente

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Imagem de miniatura gerada

Miniatura
binary

Imagem da marca (V3) (versão prévia)

Gera uma lista de palavras ou marcas relevantes para o conteúdo da imagem fornecida.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Corpo
TagResponse

Marcar imagem

Gera uma lista de palavras ou marcas relevantes para o conteúdo da imagem fornecida.

Parâmetros

Nome Chave Obrigatório Tipo Description
Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Corpo
TagResponse

Obter área de interesse

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Parâmetros

Nome Chave Obrigatório Tipo Description
Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Obter área de interesse (V3) (versão prévia)

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Reconhecer conteúdo específico do domínio

Reconhecer celebridades ou pontos de referência em uma imagem.

Parâmetros

Nome Chave Obrigatório Tipo Description
Modelo de Domínio
model True string

Modelo específico do domínio com suporte para reconhecer na imagem.

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Reconhecer conteúdo específico do domínio (V3) (versão prévia)

Reconhecer celebridades ou pontos de referência em uma imagem.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Modelo de Domínio
model True string

Modelo específico do domínio com suporte para reconhecer na imagem.

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Reconhecimento óptico de caracteres (OCR) para JSON

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável por computador.

Parâmetros

Nome Chave Obrigatório Tipo Description
Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Resposta JSON
OCRJsonResponse

Reconhecimento óptico de caracteres (OCR) para JSON (V3) (versão prévia)

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável por computador.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Resposta JSON
OCRJsonResponse

Reconhecimento óptico de caracteres (OCR) para texto

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Parâmetros

Nome Chave Obrigatório Tipo Description
Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Reconhecimento óptico de caracteres (OCR) para texto (V3) (versão prévia)

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Parâmetros

Nome Chave Obrigatório Tipo Description
Subdomínio de Recurso ou Região
subdomainName True string

Subdomínio do Azure ou região geográfica (por exemplo, westus)

Origem da imagem
format True string

Origem da imagem – incluída ou por URL de referência.

Imagem
Image True dynamic

Retornos

Definições

DomainModelResponse

Nome Caminho Tipo Description
Celebridades
result.celebrities array of object

Celebridades reconhecidas na imagem

Confiança de celebridades
result.celebrities.confidence float

Pontuação de confiança de que a imagem é de celebridade

Nome da celebridade
result.celebrities.name string

Nome da celebridade reconhecida

Marcos
result.landmarks array of object

Pontos de referência reconhecidos na imagem

Confiança de ponto de referência
result.landmarks.confidence float

Pontuação de confiança de que a imagem é de referência

Nome do ponto de referência
result.landmarks.name string

Nome do ponto de referência identificado

TagResponse

Nome Caminho Tipo Description
tags
tags array of object

Conjunto de marcas retornadas da análise de imagem.

Pontuação de confiança da marca
tags.confidence float

Pontuação de confiança da marca identificada.

Nome da Marca
tags.name string

Nome da marca identificada.

DetectResponse

Nome Caminho Tipo Description
Objetos
objects array of object

Conjunto de objetos retornados da análise de imagem.

Pontuação de confiança do objeto
objects.confidence float

Pontuação de confiança do objeto identificado.

Nome do objeto
objects.object string

Nome do objeto identificado.

AreaOfInterestResponse

OCRJsonResponse

Nome Caminho Tipo Description
Linguagem de texto
language string

Idioma detectado do texto da imagem.

Matriz de Regiões
regions array of object

Regiões de texto retornadas.

OCRTextResponse

Nome Caminho Tipo Description
Texto detectado
text string

Texto detectado na imagem analisada

AnalyzeResponse

Nome Caminho Tipo Description
categories
categories array of object

Categorias identificadas da imagem

Nome da categoria
categories.name string

Nome da categoria identificada da imagem

Pontuação de confiança de categoria
categories.score float

Pontuação de confiança para a categoria de imagem

Legendas
description.captions array of object

Lista de legendas geradas a partir da imagem

Pontuação de confiança da legenda
description.captions.confidence float

Pontuação de confiança da legenda da imagem

Texto da legenda
description.captions.text string

Legenda de texto gerada a partir da imagem

Nomes de marca
description.tags array of string

Coleção de nomes de marca.

tags
tags array of object

Marcas identificadas com pontuações de confiança.

Pontuação de confiança da marca
tags.confidence float

Pontuação de confiança para as marcas identificadas.

Nome da Marca
tags.name string

Nome da marca identificada.

DescribeResponse

Nome Caminho Tipo Description
Legendas
description.captions array of object

Lista de legendas geradas a partir da imagem

Pontuação de confiança da legenda
description.captions.confidence float

Pontuação de confiança da legenda da imagem

Texto da legenda
description.captions.text string

Legenda de texto gerada a partir da imagem

Nomes de marca
description.tags array of string

Coleção de nomes de marca.

binário

Esse é o tipo de dados básico 'binary'.