Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A Pesquisa de IA do Azure fornece recuperação de informações e usa a integração opcional de IA para extrair mais valor de conteúdos de texto e estrutura.
A tabela a seguir resume os recursos por categoria. Há paridade de recursos em todas as nuvens públicas, privadas e soberanas do Azure, mas alguns recursos não têm suporte em regiões específicas ou camadas específicas.
Note
Procurando por versões prévias dos recursos? Consulte a lista de recursos de visualização.
Indexação e extração de dados
| Category | Features |
|---|---|
| Fontes de dados | Os índices de pesquisa aceitam dados de qualquer fonte, desde que os dados sejam enviados como um documento JSON.
Indexadores são um recurso que automatiza a importação de dados de fontes de dados com suporte para extrair conteúdo pesquisável em armazenamentos de dados primários. Os indexadores lidam com a serialização JSON para você e a maioria dá suporte a alguma forma de detecção de alteração e exclusão. Você pode se conectar a uma variedade de fontes de dados, incluindo o Microsoft OneLake, o Banco de Dados SQL do Azure, o Azure Cosmos DB ou o Armazenamento de Blobs do Azure. Os conectores dos Aplicativos Lógicos (versão prévia) fornecem acesso a uma gama mais ampla de fontes de dados, incluindo dados em outras plataformas de nuvem. Esse pipeline de indexação e enriquecimento é criado na Pesquisa de IA do Azure, mas gerenciado nos Aplicativos Lógicos do Azure. |
| Estruturas de dados hierárquicas e aninhadas | Os tipos complexos e as coleções permitem que você modele praticamente qualquer tipo de estrutura JSON como um índice de pesquisa. A cardinalidade um-para-muitos e muitos-para-muitos pode ser expressa de maneira nativa por meio de coleções, tipos complexos e coleções de tipos complexos. |
| Análise linguística | Os analisadores são componentes usados para processamento de texto durante as operações de indexação e de pesquisa. Por padrão, pode ser usado o analisador Lucene Padrão de uso geral ou o padrão pode ser substituído por um analisador de linguagem, um analisador personalizado configurado ou outro analisador predefinido que produz tokens no formato necessário.
Analisadores de idioma do Lucene ou da Microsoft são usados para lidar de forma inteligente com aspectos linguísticos específicos de cada idioma, incluindo tempos verbais, gênero, substantivos plurais irregulares (por exemplo, “mouse” vs. “mice”), decomposição de palavras, separação de palavras (para idiomas sem espaços) e muito mais. Analisadores léxicos personalizados são usados para formulários de consulta complexos, como correspondência fonética e expressões regulares. |
Modelo de chat e integração de agente
| Category | Features |
|---|---|
| Modelos de conclusão de chat usados durante a indexação | A habilidade de prompt do GenAI (versão prévia) é uma habilidade que chama um modelo de linguagem grande durante a indexação e fornece um prompt que determina a tarefa. Você decide qual é a tarefa. Ele pode descrever uma imagem, resumir ou manipular conteúdo ou qualquer tarefa que o modelo possa executar. A saída é adicionada como um novo campo em um índice pesquisável. |
| Modelos de conclusão de chat usados no momento da consulta |
A recuperação por meio de agentes (versão prévia) usa um modelo de linguagem grande para planejar consultas e decompor e parafrasear consultas complexas para melhor cobertura de consulta em seu índice. As respostas da recuperação por meio de agentes foram projetadas para fluxos de trabalho de agente para agente. Você pode passar os resultados da pesquisa como uma única cadeia de caracteres grande, o que simplifica o consumo de agente de seu conteúdo proprietário. A resposta também inclui citações e informações de execução de consulta.
Padrões RAG podem ser implementados usando recursos existentes. A capacidade de ajustar a relevância e construir consultas híbridas melhora a qualidade do conteúdo enviado aos chatbots para geração de respostas. |
IA aplicada e conteúdo enriquecido por IA
| Category | Features |
|---|---|
| Processamento de IA durante a indexação | O enriquecimento de IA se refere à imagem inserida e ao processamento de linguagem natural em um pipeline do indexador que extrai texto e informações do conteúdo que não poderiam ser indexados para pesquisa de texto completo de outra forma. O processamento de IA é realizado por meio da adição e da combinação de habilidades em um conjunto de habilidades, que depois é anexado a um indexador. A IA pode ser habilidades internas da Microsoft, como tradução de texto ou OCR (reconhecimento óptico de caracteres) ou habilidades personalizadas fornecidas por você. Fragmentação e vetorização de dados integradas dividem passagens maiores em partes menores que podem ser vetorizadas, com vetores roteados para campos dedicados em um índice para pesquisa em vetor e híbrida. |
| Processamento de IA durante a execução da consulta | Vetorizadores são usados para codificar cadeias de consulta de usuário em vetores para busca em vetores. Você pode usar os mesmos modelos de inserção para consultas usadas para indexação. |
| Armazenar conteúdo aprimorado para análise e consumo em cenários que não são de pesquisa | Repositório de conhecimento é um armazenamento persistente de conteúdo enriquecido por IA ou gerado por IA, destinado a cenários que não são de pesquisa, como cargas de trabalho de mineração de conhecimento e ciência de dados. Um repositório de conhecimento é definido em um conjunto de habilidades, mas é criado no Armazenamento do Azure como objetos ou conjuntos de linhas tabulares. |
| Enriquecimentos armazenados em cache | O cache de enriquecimento (versão prévia) se refere a enriquecimentos armazenados em cache que podem ser reutilizados durante a execução do conjunto de habilidades. O cache é valioso em conjuntos de habilidades que incluem o OCR e a análise de imagem, que são caros de processar. |
Vetor e recuperação híbrida
| Category | Features |
|---|---|
| Indexação vetorial | Em um índice de pesquisa, adicione campos de vetor para dar suporte aos cenários de pesquisa de vetor. Os campos de vetor podem coexistir com os campos não vetoriais no mesmo documento de pesquisa. |
| Consultas de vetor | Formular consultas de vetor único e múltiplo. |
| Algoritmos de pesquisa de vetor | Use HNSW (Hierarchical Navigable Small World) ou K-Nearest Neighbors (KNN) exaustivo para encontrar vetores semelhantes em um índice de pesquisa. |
| Filtros de vetor | Aplicar filtros antes ou depois da execução da consulta para maior precisão durante a recuperação de informações. |
| Recuperação de informações híbridas | Pesquise conceitos e palavras-chave em uma única solicitação de consulta híbrida. A pesquisa híbrida consolida a pesquisa de vetor e texto com classificação semântica opcional e ajuste de relevância para obter melhores resultados. |
| Agrupamento e vetorização de dados integrados | Agrupamento de dados nativos por meio da habilidade de Divisão de Texto. Vetorização nativa por meio de vetorizadores e habilidades de incorporação, como Incorporação do OpenAI do Azure, a Visão do Azure multimodal e a AML que você pode usar para se conectar a pontos de extremidade no catálogo de modelos do Microsoft Foundry. A vetorização integrada fornece um pipeline de indexação de ponta a ponta de arquivos de origem para consultas. |
| Compressão vetorial e compartimentalização integradas | Use a compartimentalização escalar interna e binária para reduzir o tamanho do índice vetorial na memória e no disco. Também é possível renunciar ao armazenamento de vetores desnecessários ou atribuir tipos de dados restritos a campos de vetores para reduzir os requisitos de armazenamento. |
Texto completo e outros formulários de consulta
| Category | Features |
|---|---|
| Pesquisa de texto de forma livre |
A pesquisa de texto completo é um caso de uso primário para a maioria dos aplicativos baseados em pesquisa. As consultas podem ser formuladas usando uma sintaxe com suporte.
A sintaxe de consulta simples fornece operadores lógicos, operadores de pesquisa de frases, operadores de sufixo, operadores de precedência. Sintaxe completa de consulta Lucene inclui todas as operações em sintaxe simples, com extensões para pesquisa difusa, pesquisa por proximidade, aumento de termo e expressões regulares. |
| Relevance |
A pontuação simples é o principal benefício da IA do Azure Search. Os perfis de pontuação são usados para modelar a relevância como uma função de valores nos próprios documentos. Por exemplo, talvez você queira que produtos mais recentes ou com desconto apareçam primeiro nos resultados da pesquisa. Você também pode criar perfis de pontuação usando marcas de pontuação personalizadas com base nas preferências de pesquisa do cliente que você controlou e armazenou separadamente.
Classificador semântico é um recurso Premium que reclassifica os resultados com base na relevância semântica para a consulta. Dependendo do seu conteúdo e cenário, ele pode aprimorar significativamente a relevância da pesquisa com o mínimo de configuração ou esforço. |
| Pesquisa geoespacial | As funções geoespaciais filtram e correspondem a coordenadas geográficas. Você pode corresponder à distância ou por inclusão em uma forma de polígono. |
| Filtros e facetas |
A navegação facetada é habilitada por meio de um único parâmetro de consulta. A IA do Azure Search retorna uma estrutura de navegação mista que você pode usar como o código por trás de uma lista de categorias para a filtragem autodirigida (por exemplo, para filtrar os itens do catálogo por faixa de preços ou marca).
Filtros podem ser usados para incorporar a faceted navigation na interface do usuário do aplicativo, aprimorar a formulação de consulta e filtrar com base nos critérios especificados pelo usuário ou pelo desenvolvedor. Crie filtros usando a sintaxe OData. |
| Experiência do usuário |
O preenchimento automático pode ser habilitado para consultas de digitação antecipada em uma barra de pesquisa.
Sugestões de pesquisa também funcionam em entradas de texto parcial em uma barra de pesquisa, mas os resultados são documentos reais em seu índice em vez de termos de consulta. Sinônimos associam termos equivalentes que expandem implicitamente o escopo de uma consulta, sem que o usuário precise fornecer os termos alternativos. Realce de ocorrência aplica a formatação de texto a uma palavra-chave correspondente nos resultados da pesquisa. Você pode escolher quais campos retornam snippets realçados. A classificação é oferecida para vários campos por meio do esquema de índice e, em seguida, alternada em tempo de consulta com um único parâmetro de pesquisa. Paginação e limitação dos resultados da pesquisa são diretos, graças ao controle preciso que a Pesquisa de IA do Azure oferece sobre os resultados da pesquisa. |
Recursos de segurança
| Category | Features |
|---|---|
| Segurança de rede |
As regras de IP para suporte ao firewall de entrada permitem que você configure intervalos de IP nos quais o serviço de pesquisa aceita solicitações.
Crie um ponto de extremidade privado usando o Link Privado do Azure para forçar todas as solicitações por meio de uma rede virtual. O suporte ao perímetro de segurança de rede permite que você ingresse na Pesquisa de IA do Azure em um perímetro de segurança de rede que inclua outros recursos do Azure para que você possa gerenciar o acesso à rede de forma holística. |
| Criptografia de dados |
A criptografia inativa gerenciada pela Microsoft está incorporada à camada de armazenamento interno e é irrevogável.
As CMK (chaves de criptografia gerenciadas pelo cliente) que você cria e gerencia no Azure Key Vault podem ser usadas para criptografia suplementar de índices e mapas de sinônimos. Para serviços criados após 1º de agosto de 2020, a criptografia CMK se estende aos dados em discos temporários, para criptografia dupla completa de conteúdo indexado. |
| Acesso de entrada |
O controle de acesso baseado na função atribui funções a usuários e grupos no Microsoft Entra ID para acesso controlado ao conteúdo e operações de pesquisa. Você também poderá usar a autenticação baseada em chave se não quiser usar atribuições de função.
O controle de acesso no nível do documento (versão prévia) filtra os resultados da pesquisa que um usuário não está autorizado a ver. Para várias fontes de dados, se a fonte de dados fornecer um modelo de controle de acesso, você poderá configurar um índice para herdar os metadados de permissão do usuário. |
| Segurança de saída (indexadores) |
As conexões de dados por meio de pontos de extremidade privados permitem que um indexador se conecte aos recursos do Azure protegidos por meio do Link Privado do Azure.
As conexões de dados por meio de identidades gerenciadas autenticam conexões com recursos do Azure usando uma entidade de segurança do Microsoft Entra, que elimina o armazenamento e a passagem de chaves de API codificadas. Acesso a dados usando uma identidade confiável significa que as cadeias de conexão para fontes de dados externas podem omitir nomes de usuário e senhas. Quando um indexador se conecta à fonte de dados, o recurso permite a conexão se o serviço de pesquisa foi registrado anteriormente como um serviço confiável (aplica-se somente ao Armazenamento do Microsoft Azure). |
Recursos do portal
| Category | Features |
|---|---|
| Ferramentas para criação de protótipos e inspeção |
Adicionar índice é um designer de índice no portal do Azure que você pode usar para criar um esquema básico que consiste em campos atribuídos e algumas outras configurações. Depois de salvar o índice, você pode preenchê-lo usando um SDK ou a API REST para fornecer os dados.
O assistente de importação de dados cria índices, indexadores, conjuntos de habilidades e definições de fonte de dados. Se os dados existem no Azure, esse assistente pode poupar tempo e esforço significativos, especialmente para investigação e exploração de prova de conceito. O assistente de importação de dados (novo) cria um pipeline de indexação completo que inclui agrupamento e vetorização de dados. O assistente cria todos os objetos e definições de configuração. O Gerenciador de Pesquisa é usado para testar consultas e refinar perfis de pontuação. Criar um aplicativo de demonstração é usado para gerar uma página HTML que pode ser usada para testar a experiência de pesquisa. Depurar Sessões é um editor visual que permite depurar um conjunto de habilidades interativamente. Ele mostra as dependências, a saída e as transformações. |
| Monitoramento e diagnóstico | Habilitar recursos de monitoramento para ir além das métricas que estão sempre visíveis no portal do Azure. As métricas nas consultas por segundo, latência e limitação são capturadas e informadas nas páginas do portal sem nenhuma configuração adicional necessária. |
Programmability
| Category | Features |
|---|---|
| REST |
A API REST de Serviço destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.
API REST de Gerenciamento destina-se à criação do serviço e à limpeza por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |
| SDK do Azure para .NET |
A Azure.Search.Documents destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.
Microsoft.Azure.Management.Search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |
| SDK do Azure para Java |
A com.azure.search.documents destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.
com.microsoft.azure.management.search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |
| SDK do Azure para Python |
A azure-search-documents destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.
azure-mgmt-search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |
| SDK do Azure para JavaScript/TypeScript |
A azure/search-documents destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.
azure/arm-search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |