Partilhar via


CustomAnalyzer interface

Permite que você assuma o controle sobre o processo de conversão de texto em tokens indexáveis/pesquisáveis. É uma configuração definida pelo usuário que consiste em um único tokenizador predefinido e um ou mais filtros. O tokenizador é responsável por dividir o texto em tokens, e os filtros para modificar tokens emitidos pelo tokenizador.

Propriedades

charFilters

Uma lista de filtros de caracteres usados para preparar o texto de entrada antes de ser processado pelo tokenizador. Por exemplo, eles podem substituir certos caracteres ou símbolos. Os filtros são executados na ordem em que são listados.

name

O nome do analisador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

odatatype

Discriminador Polimórfico

tokenFilters

Uma lista de filtros de token usados para filtrar ou modificar os tokens gerados por um tokenizador. Por exemplo, você pode especificar um filtro minúsculo que converta todos os caracteres em minúsculas. Os filtros são executados na ordem em que são listados.

tokenizerName

O nome do tokenizador a ser usado para dividir o texto contínuo em uma sequência de tokens, como quebrar uma frase em palavras. KnownTokenizerNames é um enum que contém nomes de tokenizadores internos.

Detalhes de Propriedade

charFilters

Uma lista de filtros de caracteres usados para preparar o texto de entrada antes de ser processado pelo tokenizador. Por exemplo, eles podem substituir certos caracteres ou símbolos. Os filtros são executados na ordem em que são listados.

charFilters?: string[]

Valor de Propriedade

string[]

name

O nome do analisador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

name: string

Valor de Propriedade

string

odatatype

Discriminador Polimórfico

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Valor de Propriedade

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Uma lista de filtros de token usados para filtrar ou modificar os tokens gerados por um tokenizador. Por exemplo, você pode especificar um filtro minúsculo que converta todos os caracteres em minúsculas. Os filtros são executados na ordem em que são listados.

tokenFilters?: string[]

Valor de Propriedade

string[]

tokenizerName

O nome do tokenizador a ser usado para dividir o texto contínuo em uma sequência de tokens, como quebrar uma frase em palavras. KnownTokenizerNames é um enum que contém nomes de tokenizadores internos.

tokenizerName: string

Valor de Propriedade

string