API da Pesquisa Visual Computacional

Extraia informações avançadas de imagens para categorizar e processar dados visuais e proteger seus usuários contra conteúdo indesejado com esse Serviço Cognitivo do Azure.

Esse conector está disponível nos seguintes produtos e regiões:

Service	Class	Regions
Copilot Studio	Standard	Todas as regiões do Power Automate
Aplicativos Lógicos	Standard	Todas as regiões de Aplicativos Lógicos
Power Apps	Standard	Todas as regiões do Power Apps
Power Automate	Standard	Todas as regiões do Power Automate

Contato
Nome	Microsoft
URL	Suporte do Microsoft LogicApps Suporte do Microsoft Power Automate Suporte do Microsoft Power Apps

Metadados do conector
Publicador	Microsoft
Site	https://azure.microsoft.com/services/cognitive-services/computer-vision/

Para usar essa integração, você precisará de um recurso do Serviço Cognitivo no portal do Azure. Você obterá um ponto de extremidade e uma chave para autenticar seus aplicativos. Para fazer uma conexão, forneça a chave da conta, a URL do site e selecione Criar conexão. Para os custos de operação em sua conexão, saiba mais aqui.

Agora você está pronto para começar a usar essa integração.

Problemas e limitações conhecidos

Observe que os resultados da operação podem estar incompletos devido à natureza da API do Serviço Cognitivo subjacente, que se baseia no aprendizado de máquina e no reconhecimento de padrões.

Conectando-se à ID do Microsoft Entra

Para criar conexões com a ID do Microsoft Entra, você deve adicionar a função de Usuário dos Serviços Cognitivos à sua conta para acessar. Para usar essa conexão, você deve inserir o subdomínio exclusivo associado ao recurso dos Serviços Cognitivos nas operações de suporte.

Operações sem suporte com a autenticação da ID do Microsoft Entra

Ao usar a autenticação da ID do Microsoft Entra , há suporte apenas para ações V3. As ações preteridas continuarão a funcionar com Access Key a autenticação, mas falharão se forem usadas com uma conexão de ID do Microsoft Entra.

Criando uma conexão

O conector dá suporte aos seguintes tipos de autenticação:


Chave de API	ApiKey	Todas as regiões	Compartilhável
Padrão [PRETERIDO]	Essa opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores.	Todas as regiões	Não compartilhável

Chave de API

ID de autenticação: keyBasedAuth

Aplicável: todas as regiões

ApiKey

Essa é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, a conexão também será compartilhada. Para obter mais informações, consulte a visão geral dos Conectores para aplicativos de tela – Power Apps | Microsoft Docs

Nome	Tipo	Description	Obrigatório
Chave de Conta	secureString	Chave de Conta dos Serviços Cognitivos	Verdade
URL do site	cadeia	URL do site raiz (exemplo: https://westus.api.cognitive.microsoft.com)

Padrão [PRETERIDO]

Aplicável: todas as regiões

Essa opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores.

Essa não é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome	Tipo	Description	Obrigatório
Chave de Conta	secureString	Chave de Conta dos Serviços Cognitivos	Verdade
URL do site	cadeia	URL do site raiz (exemplo: https://westus.api.cognitive.microsoft.com ). Se a URL do site não especificada for padronizada como 'https://westus.api.cognitive.microsoft.com'.

Limitações

Nome	Chamadas	Período de renovação
Chamadas à API por conexão	1200	60 segundos

Ações

Analisar imagem (V3) (versão prévia)	Essa operação extrai um conjunto avançado de recursos visuais com base no conteúdo da imagem.
Análise de Imagem	Essa operação extrai um conjunto avançado de recursos visuais com base no conteúdo da imagem.
Descrever a URL da Imagem	Essa operação gera uma descrição de uma URL de imagem em linguagem legível humana com frases completas.
Descrever a URL da Imagem (V3) (versão prévia)	Essa operação gera uma descrição de uma URL de imagem em linguagem legível humana com frases completas.
Descrever imagem	Essa operação gera uma descrição de uma imagem em linguagem legível humana com frases completas.
Descrever imagem (V3) (versão prévia)	Essa operação gera uma descrição de uma imagem em linguagem legível humana com frases completas.
Descrever o conteúdo da imagem	Essa operação gera uma descrição do conteúdo da imagem em linguagem legível humana com frases completas.
Descrever o conteúdo da imagem (V3) (versão prévia)	Essa operação gera uma descrição do conteúdo da imagem em linguagem legível humana com frases completas.
Detectar objetos	Gera uma lista de objetos detecdos na imagem fornecida.
Detectar objetos (V3) (versão prévia)	Gera uma lista de objetos detecdos na imagem fornecida.
Gerar miniatura	Essa operação gera uma imagem em miniatura com a largura e a altura especificadas pelo usuário.
Gerar miniatura (V3) (versão prévia)	Essa operação gera uma imagem em miniatura com a largura e a altura especificadas pelo usuário.
Imagem da marca (V3) (versão prévia)	Gera uma lista de palavras ou marcas relevantes para o conteúdo da imagem fornecida.
Marcar imagem	Gera uma lista de palavras ou marcas relevantes para o conteúdo da imagem fornecida.
Obter área de interesse	Retorna uma caixa delimitadora em torno da área mais importante da imagem.
Obter área de interesse (V3) (versão prévia)	Retorna uma caixa delimitadora em torno da área mais importante da imagem.
Reconhecer conteúdo específico do domínio	Reconhecer celebridades ou pontos de referência em uma imagem.
Reconhecer conteúdo específico do domínio (V3) (versão prévia)	Reconhecer celebridades ou pontos de referência em uma imagem.
Reconhecimento óptico de caracteres (OCR) para JSON	O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável por computador.
Reconhecimento óptico de caracteres (OCR) para JSON (V3) (versão prévia)	O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável por computador.
Reconhecimento óptico de caracteres (OCR) para texto	O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.
Reconhecimento óptico de caracteres (OCR) para texto (V3) (versão prévia)	O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Analisar imagem (V3) (versão prévia)

ID da operação:: AnalyzeImageV3

Essa operação extrai um conjunto avançado de recursos visuais com base no conteúdo da imagem.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Linguagem	language		string	O serviço retornará os resultados de reconhecimento no idioma especificado.
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: AnalyzeResponse

Análise de Imagem

ID da operação:: AnalyzeImageV2

Essa operação extrai um conjunto avançado de recursos visuais com base no conteúdo da imagem.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Linguagem	language		string	O serviço retornará os resultados de reconhecimento no idioma especificado.
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: AnalyzeResponse

Descrever a URL da Imagem

ID da operação:: DescribeImageURLV2

Essa operação gera uma descrição de uma URL de imagem em linguagem legível humana com frases completas.

Parâmetros

Nome	Chave	Tipo	Description
Máximo de candidatos	maxCandidates	number	Número máximo de descrições de candidatos a serem retornadas.
Linguagem	language	string	O serviço retornará os resultados de reconhecimento no idioma especificado.
URL da imagem	url	url	Origem da referência de imagem por URL.

Retornos

Corpo: DescribeResponse

Descrever a URL da Imagem (V3) (versão prévia)

ID da operação:: DescribeImageURLV3

Essa operação gera uma descrição de uma URL de imagem em linguagem legível humana com frases completas.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Máximo de candidatos	maxCandidates		number	Número máximo de descrições de candidatos a serem retornadas.
Linguagem	language		string	O serviço retornará os resultados de reconhecimento no idioma especificado.
URL da imagem	url		url	Origem da referência de imagem por URL.

Retornos

Corpo: DescribeResponse

Descrever imagem

ID da operação:: DescribeImageV2

Essa operação gera uma descrição de uma imagem em linguagem legível humana com frases completas.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Máximo de candidatos	maxCandidates		number	Número máximo de descrições de candidatos a serem retornadas.
Linguagem	language		string	O serviço retornará os resultados de reconhecimento no idioma especificado.
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: DescribeResponse

Descrever imagem (V3) (versão prévia)

ID da operação:: DescribeImageV3

Essa operação gera uma descrição de uma imagem em linguagem legível humana com frases completas.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Máximo de candidatos	maxCandidates		number	Número máximo de descrições de candidatos a serem retornadas.
Linguagem	language		string	O serviço retornará os resultados de reconhecimento no idioma especificado.
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: DescribeResponse

Descrever o conteúdo da imagem

ID da operação:: DescribeImageContentV2

Essa operação gera uma descrição do conteúdo da imagem em linguagem legível humana com frases completas.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Máximo de candidatos	maxCandidates		number	Número máximo de descrições de candidatos a serem retornadas.
Linguagem	language		string	O serviço retornará os resultados de reconhecimento no idioma especificado.
Conteúdo da Imagem	Image	True	binary	Origem da referência de imagem no corpo.

Retornos

Corpo: DescribeResponse

Descrever o conteúdo da imagem (V3) (versão prévia)

ID da operação:: DescribeImageContentV3

Essa operação gera uma descrição do conteúdo da imagem em linguagem legível humana com frases completas.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Máximo de candidatos	maxCandidates		number	Número máximo de descrições de candidatos a serem retornadas.
Linguagem	language		string	O serviço retornará os resultados de reconhecimento no idioma especificado.
Conteúdo da Imagem	Image	True	binary	Origem da referência de imagem no corpo.

Retornos

Corpo: DescribeResponse

Detectar objetos

ID da operação:: DetectObjects

Gera uma lista de objetos detecdos na imagem fornecida.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: DetectResponse

Detectar objetos (V3) (versão prévia)

ID da operação:: DetectObjectsV3

Gera uma lista de objetos detecdos na imagem fornecida.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: DetectResponse

Gerar miniatura

ID da operação:: GetThumbnailV2

Essa operação gera uma imagem em miniatura com a largura e a altura especificadas pelo usuário.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Largura da miniatura	width	True	number	Largura da miniatura gerada – recomendado é 50
Altura da miniatura	height	True	number	Altura da miniatura gerada – recomendado é 50
Corte Inteligente	smartCropping		boolean	Sinalizador booliano para habilitar o corte inteligente
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Imagem de miniatura gerada

Miniatura: binary

Gerar miniatura (V3) (versão prévia)

ID da operação:: GetThumbnailV3

Essa operação gera uma imagem em miniatura com a largura e a altura especificadas pelo usuário.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Largura da miniatura	width	True	number	Largura da miniatura gerada – recomendado é 50
Altura da miniatura	height	True	number	Altura da miniatura gerada – recomendado é 50
Corte Inteligente	smartCropping		boolean	Sinalizador booliano para habilitar o corte inteligente
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Imagem de miniatura gerada

Miniatura: binary

Imagem da marca (V3) (versão prévia)

ID da operação:: TagImageV3

Gera uma lista de palavras ou marcas relevantes para o conteúdo da imagem fornecida.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: TagResponse

Marcar imagem

ID da operação:: TagImageV2

Gera uma lista de palavras ou marcas relevantes para o conteúdo da imagem fornecida.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: TagResponse

Obter área de interesse

ID da operação:: GetAreaOfInterest

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: AreaOfInterestResponse

Obter área de interesse (V3) (versão prévia)

ID da operação:: GetAreaOfInterestV3

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: AreaOfInterestResponse

Reconhecer conteúdo específico do domínio

ID da operação:: RecognizeDomainSpecificContentV2

Reconhecer celebridades ou pontos de referência em uma imagem.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Modelo de Domínio	model	True	string	Modelo específico do domínio com suporte para reconhecer na imagem.
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: DomainModelResponse

Reconhecer conteúdo específico do domínio (V3) (versão prévia)

ID da operação:: RecognizeDomainSpecificContentV3

Reconhecer celebridades ou pontos de referência em uma imagem.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Modelo de Domínio	model	True	string	Modelo específico do domínio com suporte para reconhecer na imagem.
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: DomainModelResponse

Reconhecimento óptico de caracteres (OCR) para JSON

ID da operação:: OCRV2

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável por computador.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Resposta JSON: OCRJsonResponse

Reconhecimento óptico de caracteres (OCR) para JSON (V3) (versão prévia)

ID da operação:: OCRV3

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável por computador.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Resposta JSON: OCRJsonResponse

Reconhecimento óptico de caracteres (OCR) para texto

ID da operação:: OCRTextV2

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: OCRTextResponse

Reconhecimento óptico de caracteres (OCR) para texto (V3) (versão prévia)

ID da operação:: OCRTextV3

O OCR (Reconhecimento Óptico de Caracteres) detecta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Parâmetros

Nome	Chave	Obrigatório	Tipo	Description
Subdomínio de Recurso ou Região	subdomainName	True	string	Subdomínio do Azure ou região geográfica (por exemplo, westus)
Origem da imagem	format	True	string	Origem da imagem – incluída ou por URL de referência.
Imagem	Image	True	dynamic

Retornos

Corpo: OCRTextResponse

Definições

DomainModelResponse

Nome	Caminho	Tipo	Description
Celebridades	result.celebrities	array of object	Celebridades reconhecidas na imagem
Confiança de celebridades	result.celebrities.confidence	float	Pontuação de confiança de que a imagem é de celebridade
Nome da celebridade	result.celebrities.name	string	Nome da celebridade reconhecida
Marcos	result.landmarks	array of object	Pontos de referência reconhecidos na imagem
Confiança de ponto de referência	result.landmarks.confidence	float	Pontuação de confiança de que a imagem é de referência
Nome do ponto de referência	result.landmarks.name	string	Nome do ponto de referência identificado

TagResponse

Nome	Caminho	Tipo	Description
tags	tags	array of object	Conjunto de marcas retornadas da análise de imagem.
Pontuação de confiança da marca	tags.confidence	float	Pontuação de confiança da marca identificada.
Nome da Marca	tags.name	string	Nome da marca identificada.

DetectResponse

Nome	Caminho	Tipo	Description
Objetos	objects	array of object	Conjunto de objetos retornados da análise de imagem.
Pontuação de confiança do objeto	objects.confidence	float	Pontuação de confiança do objeto identificado.
Nome do objeto	objects.object	string	Nome do objeto identificado.

AreaOfInterestResponse

OCRJsonResponse

Nome	Caminho	Tipo	Description
Linguagem de texto	language	string	Idioma detectado do texto da imagem.
Matriz de Regiões	regions	array of object	Regiões de texto retornadas.

OCRTextResponse

Nome	Caminho	Tipo	Description
Texto detectado	text	string	Texto detectado na imagem analisada

AnalyzeResponse

Nome	Caminho	Tipo	Description
categories	categories	array of object	Categorias identificadas da imagem
Nome da categoria	categories.name	string	Nome da categoria identificada da imagem
Pontuação de confiança de categoria	categories.score	float	Pontuação de confiança para a categoria de imagem
Legendas	description.captions	array of object	Lista de legendas geradas a partir da imagem
Pontuação de confiança da legenda	description.captions.confidence	float	Pontuação de confiança da legenda da imagem
Texto da legenda	description.captions.text	string	Legenda de texto gerada a partir da imagem
Nomes de marca	description.tags	array of string	Coleção de nomes de marca.
tags	tags	array of object	Marcas identificadas com pontuações de confiança.
Pontuação de confiança da marca	tags.confidence	float	Pontuação de confiança para as marcas identificadas.
Nome da Marca	tags.name	string	Nome da marca identificada.

DescribeResponse

Nome	Caminho	Tipo	Description
Legendas	description.captions	array of object	Lista de legendas geradas a partir da imagem
Pontuação de confiança da legenda	description.captions.confidence	float	Pontuação de confiança da legenda da imagem
Texto da legenda	description.captions.text	string	Legenda de texto gerada a partir da imagem
Nomes de marca	description.tags	array of string	Coleção de nomes de marca.

binário

Esse é o tipo de dados básico 'binary'.

Compartilhar via

API da Pesquisa Visual Computacional

Problemas e limitações conhecidos

Conectando-se à ID do Microsoft Entra

Operações sem suporte com a autenticação da ID do Microsoft Entra

Criando uma conexão

Chave de API

Padrão [PRETERIDO]

Limitações

Ações

Analisar imagem (V3) (versão prévia)

Parâmetros

Retornos

Análise de Imagem

Parâmetros

Retornos

Descrever a URL da Imagem

Parâmetros

Retornos

Descrever a URL da Imagem (V3) (versão prévia)

Parâmetros

Retornos

Descrever imagem

Parâmetros

Retornos

Descrever imagem (V3) (versão prévia)

Parâmetros

Retornos

Descrever o conteúdo da imagem

Parâmetros

Retornos

Descrever o conteúdo da imagem (V3) (versão prévia)

Parâmetros

Retornos

Detectar objetos

Parâmetros

Retornos

Detectar objetos (V3) (versão prévia)

Parâmetros

Retornos

Gerar miniatura

Parâmetros

Retornos

Gerar miniatura (V3) (versão prévia)

Parâmetros

Retornos

Imagem da marca (V3) (versão prévia)

Parâmetros

Retornos

Marcar imagem

Parâmetros

Retornos

Obter área de interesse

Parâmetros

Retornos

Obter área de interesse (V3) (versão prévia)

Parâmetros

Retornos

Reconhecer conteúdo específico do domínio

Parâmetros

Retornos

Reconhecer conteúdo específico do domínio (V3) (versão prévia)

Parâmetros

Retornos

Reconhecimento óptico de caracteres (OCR) para JSON

Parâmetros

Retornos

Reconhecimento óptico de caracteres (OCR) para JSON (V3) (versão prévia)

Parâmetros

Retornos

Reconhecimento óptico de caracteres (OCR) para texto

Parâmetros

Retornos

Reconhecimento óptico de caracteres (OCR) para texto (V3) (versão prévia)

Parâmetros

Retornos

Definições

DomainModelResponse

TagResponse

DetectResponse