Partilhar via


Alterações de comportamento na pesquisa de Full-Text

Este tópico descreve as alterações de comportamento na pesquisa de texto completo. As alterações de comportamento afetam como os recursos funcionam ou interagem no SQL Server 2014 em comparação com versões anteriores do SQL Server.

Alterações de comportamento na pesquisa Full-Text no SQL Server 2014

Informações que virão mais tarde.

Alterações de comportamento na pesquisa de Full-Text no SQL Server 2012

O SQL Server 2012 instala uma nova versão dos separadores de palavras e lematizadores para inglês dos EUA (LCID 1033) e inglês do Reino Unido (LCID 2057). No entanto, você poderá alternar para a versão anterior desses componentes se quiser manter o comportamento anterior. Para obter mais informações, consulte Alterar o Separador de Palavras usado para inglês dos EUA e inglês do Reino Unido.

Novos separadores de palavras e lematizadores instalados

O SQL Server 2012 atualiza todos os separadores de palavras e lematizadores usados pelo Full-Text Pesquisa e Pesquisa Semântica. Para obter consistência entre o conteúdo dos índices e os resultados das consultas, recomendamos que você repovoe índices de texto completo existentes.

  1. Há novos separadores de palavras para inglês. Caso você precise manter o comportamento anterior, consulte Alterar o Separador de Palavras usado para inglês dos EUA e inglês do Reino Unido.

  2. Os separadores de palavras de terceiros para dinamarquês, polonês e turco que foram incluídos nas versões anteriores do SQL Server foram substituídos por componentes da Microsoft. Os novos componentes são habilitados por padrão.

  3. Há novos separadores de palavras para tcheco e grego. As versões anteriores do SQL Server Full-Text Search não incluíam suporte para esses dois idiomas.

Alterações de comportamento de novos separadores de palavras e lematizadores

Os novos componentes podem retornar resultados diferentes dos componentes mais antigos quando você preenche e consulta índices de texto completo. As tabelas a seguir demonstram algumas das diferenças que podem ser esperadas nos resultados em inglês.

Se você precisar manter o comportamento anterior dos separadores de palavras e lematizadores, consulte os seguintes tópicos:

Em alguns casos, os novos componentes retornam mais resultados:

Prazo Resultados com separador de palavras e lematizador anteriores Resultados com novo separador de palavras e lematizador
cachorro-gato gato

cachorro
gato

cachorro-gato

cachorro
cat@dog.com gato

com

cachorro
gato

cat@dog.com

com

cachorro
12/11/2011

(em que o termo é uma data)
12/11/2011

dd20111211
11

12

12/11/2011

2011

dd20111211

Em alguns casos, os novos componentes retornam resultados semelhantes :

Prazo Resultados com separador de palavras e lematizador anteriores Resultados com novo separador de palavras e lematizador
100$ 100$

nn100$
100$

nn100dólar
022 022

nn022
022

nn22
10h49

(em que o termo é um tempo)
10h49

tt1049
10h49

tt24104900

Em alguns casos, os novos componentes retornam menos resultados ou resultados que podem ser inesperados por aplicativos:

Prazo Resultados com separador de palavras e lematizador anteriores Resultados com novo separador de palavras e lematizador
jěˊÿqℭžl

(em que os termos não são caracteres em inglês válidos)
jěˊÿqℭžl je yq zl
tabelas tabelas

tabela
tabelas
gato- gato

gato-
gato
v-z*(onde v e z são palavras de ruído)* (sem resultados) v-z
US$ 100 mil US$ 100

000

nn000

nn100$

USD
US$ 100 mil

nn100000usd
bela terra dos EUA lindo

terra

u.s

nos
lindo

terra
Monte Kent e Monte Challenger desafiante

Kent

Mt

Mt.
Mt

Kent

concorrente

Alterações de comportamento na pesquisa de Full-Text no SQL Server 2008

No SQL Server 2008 e versões posteriores, o mecanismo de Full-Text é integrado como um serviço de banco de dados ao banco de dados relacional como parte da infraestrutura do mecanismo de consulta e armazenamento do servidor. A nova arquitetura de pesquisa de texto completo atinge as seguintes metas:

  • O armazenamento integrado e a pesquisa de gerenciamento de texto completo agora são integrados diretamente aos recursos inerentes de armazenamento e gerenciamento do SQL Server e o serviço MSFTESQL não existe mais.

    • Os índices de texto completo são armazenados dentro dos grupos de arquivos de banco de dados, em vez de no sistema de arquivos. As operações administrativas em um banco de dados, como a criação de um backup, afetam automaticamente seus índices de texto completo.

    • Um catálogo de texto completo agora é um objeto virtual que não pertence a nenhum grupo de arquivos; é um conceito lógico que se refere a um grupo de índices de texto completo. Portanto, muitos recursos de gerenciamento de catálogo foram preteridos e a substituição criou alterações significativas para alguns recursos. Para obter mais informações, consulte Recursos obsoletos do Mecanismo de Banco de Dados no SQL Server 2014 e Alterações drásticas na pesquisa de Full-Text.

      Observação

      SQL Server 2005 Transact-SQL as instruções DDL que especificam catálogos de texto completo funcionam corretamente.

  • Processamento de consulta integrado- O novo processador de consulta de pesquisa de texto completo faz parte do Mecanismo de Banco de Dados e é totalmente integrado ao processador de consulta do SQL Server. Isso significa que o otimizador de consulta reconhece predicados de consulta de texto completo e os executa automaticamente da maneira mais eficiente possível.

  • A administração aprimorada e a pesquisa de texto completo integrada à solução de problemas fornecem ferramentas para ajudá-lo a analisar estruturas de pesquisa, como o índice de texto completo, a saída de um determinado separador de palavras, configuração de palavras irrelevantes e assim por diante.

  • Stopwords e stoplists substituíram termos de ruído e arquivos de termos de ruído. Uma lista de palavras de parada é um objeto de banco de dados que facilita as tarefas de gerenciamento para essas palavras e melhora a integridade entre diferentes instâncias de servidor e ambientes. Para obter mais informações, veja Configurar e gerenciar palavras irrelevantes e listas de palavras irrelevantes para pesquisa de texto completo.

  • O SQL Server 2008 e versões posteriores incluem novos separadores de palavras para muitos dos idiomas existentes no SQL Server 2005. Somente os separadores de palavras para inglês, coreano, tailandês e chinês (todas as formas) permanecem os mesmos. Para outros idiomas, se um catálogo de texto completo foi importado quando um banco de dados do SQL Server 2005 foi atualizado para o SQL Server 2008 ou uma versão posterior, um ou mais idiomas usados pelos índices de texto completo no catálogo de texto completo agora podem estar associados a novos separadores de palavras que podem se comportar ligeiramente diferente dos separadores de palavras importados. Para obter mais informações sobre como garantir a consistência entre consultas e o conteúdo do índice de texto completo, consulte Atualizar Full-Text Pesquisa.

  • Um novo serviço de Inicializador FDHOST (MSSQLFDLauncher) foi adicionado. Para obter mais informações, consulte Introdução à Pesquisa de Full-Text.

  • A indexação de texto completo funciona com uma coluna FILESTREAM da mesma forma que funciona com uma varbinary(max) coluna. A tabela FILESTREAM deve ter uma coluna que contenha a extensão de nome de arquivo para cada BLOB FILESTREAM. Para obter mais informações, consulte Consulta com Full-Text Pesquisar, Configurar e Gerenciar Filtros para Pesquisa e sys.fulltext_document_types (Transact-SQL).

    O mecanismo de texto completo indexa o conteúdo dos BLOBs FILESTREAM. Indexar arquivos como imagens pode não ser útil. Quando um BLOB FILESTREAM é atualizado, ele é reindexado.

Consulte Também

Pesquisa de texto completo
Full-Text pesquisar compatibilidade com versões anteriores
Atualizar Pesquisa Full-Text
Iniciar a pesquisa de texto completo