Partilhar via


Categorização das imagens

Além de tags e uma descrição, o Image Analysis 3.2 pode retornar as categorias baseadas em taxonomia detetadas em uma imagem. Ao contrário das tags, as categorias são organizadas em uma hierarquia pai/filho, e há menos delas (86, em oposição a milhares de tags). Todos os nomes das categorias estão em inglês. A categorização pode ser feita sozinha ou na mesma chamada de API do modelo de tags mais recente.

A taxonomia de 86 categorias

O Azure Vision no Foundry Tools pode categorizar uma imagem de forma ampla ou específica, usando a lista de 86 categorias no diagrama seguinte. Para obter a taxonomia completa no formato de texto, veja Categoria Taxonomia.

Listas agrupadas de todas as categorias na taxonomia de categorias

Exemplos de categorização de imagens

A seguinte resposta JSON ilustra o que o Azure Vision retorna ao categorizar a imagem de exemplo com base nas suas características visuais.

Uma mulher no telhado de um prédio de apartamentos

{
    "categories": [
        {
            "name": "people_",
            "score": 0.81640625
        }
    ],
    "requestId": "bae7f76a-1cc7-4479-8d29-48a694974705",
    "metadata": {
        "height": 200,
        "width": 300,
        "format": "Jpeg"
    }
}

A tabela seguinte ilustra um conjunto típico de imagens e a categoria devolvida pelo Azure Vision para cada imagem.

Imagem Categoria
Quatro pessoas posaram juntas como uma família grupo_de_pessoas
Um cachorro sentado em um campo gramado animal_cão
Uma pessoa em pé em uma rocha da montanha ao pôr do sol montanha ao ar livre
Uma pilha de pães numa mesa comida_pão

Utilizar a API

O recurso de categorização faz parte da API Analyze Image 3.2 . Você pode chamar essa API por meio de um SDK nativo ou por meio de chamadas REST. Inclua Categories no parâmetro de consulta visualFeatures. Em seguida, quando você obtiver a resposta JSON completa, basta analisar a cadeia de caracteres para o conteúdo da "categories" seção.

Aprenda os conceitos relacionados de marcação de imagens e descrição de imagens.