Partilhar via


Escolher um armazenamento de dados de pesquisa no Azure

Este artigo compara as opções de tecnologia para armazenamentos de dados de pesquisa no Azure. Um armazenamento de dados de pesquisa é usado para criar e armazenar índices especializados para realizar pesquisas em texto de forma livre. O texto indexado pode residir em um armazenamento de dados separado, como o armazenamento de blobs. Um aplicativo envia uma consulta para o armazenamento de dados de pesquisa e o resultado é uma lista de documentos correspondentes. Para obter mais informações sobre esse cenário, consulte Processando texto de forma livre para pesquisa.

Quais são as suas opções ao escolher um armazenamento de dados de pesquisa?

No Azure, todos os armazenamentos de dados a seguir atenderão aos requisitos principais de pesquisa em dados de texto de forma livre fornecendo um índice de pesquisa:

Principais critérios de seleção

Para cenários de pesquisa, comece a escolher o armazenamento de dados de pesquisa apropriado para suas necessidades respondendo a estas perguntas:

  • Você quer um serviço gerenciado em vez de gerenciar seus próprios servidores?

  • Pode especificar o seu esquema de índice no momento do design? Caso contrário, escolha uma opção que ofereça suporte a esquemas atualizáveis.

  • Você precisa de um índice apenas para pesquisa de texto completo ou também precisa de agregação rápida de dados numéricos e outras análises? Se você precisar de funcionalidades além da pesquisa de texto completo, considere opções que ofereçam suporte a análises adicionais.

  • Você precisa de um índice de pesquisa para o Log Analytics, com suporte para coleta, agregação e visualizações de logs em dados indexados? Em caso afirmativo, considere Elasticsearch, que faz parte de uma pilha de Log Analytics.

  • Você precisa indexar dados em formatos de documento comuns, como PDF, Word, PowerPoint e Excel? Em caso afirmativo, escolha uma opção que forneça indexadores de documentos.

  • A sua base de dados tem necessidades de segurança específicas? Se sim, considere as seguintes características de segurança.

Matriz de capacidades

As tabelas a seguir resumem as principais diferenças nos recursos.

Capacidades gerais

Capacidade Pesquisa AI Pesquisa elástica Base de Dados SQL
É serviço gerenciado Sim Não Sim
API REST Sim Sim Não
Programabilidade .NET, Java, Python, JavaScript Java T-SQL
Indexadores de documentos para tipos de ficheiros comuns (por exemplo, PDF, DOCX e TXT) Sim Não Não

Recursos de capacidade de gerenciamento

Capacidade Pesquisa AI Pesquisa elástica Base de Dados SQL
Esquema atualizável Sim Sim Sim
Suportes escalonados Sim Sim Não

Capacidades de trabalho analítico

Capacidade Pesquisa AI Pesquisa elástica Base de Dados SQL
Suporta análises além da pesquisa de texto completo Não Sim Sim
Parte de uma stack de Log Analytics Não Sim (ELK) Não
Suporta pesquisa semântica Sim (encontrar apenas documentos semelhantes) Sim Sim

Funcionalidades de segurança

Capacidade Pesquisa AI Pesquisa elástica Base de Dados SQL
Segurança a nível de linha Parcial (requer consulta de aplicativo para filtrar por ID de grupo) Parcial (requer consulta de aplicativo para filtrar por ID de grupo) Sim
Encriptação de dados transparente Não Não Sim
Restringir o acesso a endereços IP específicos Sim Sim Sim
Restringir o acesso para permitir apenas o acesso à rede virtual Sim Sim Sim
Autenticação do Ative Directory (autenticação integrada) Não Não Sim

Contribuidores

Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.

Autor principal:

Próximos passos