PatternTokenizer interface

Paquete:: @azure/search-documents

Tokenizer que usa la coincidencia de patrones regex para construir tokens distintos. Este tokenizador se implementa mediante Apache Lucene.

Propiedades

flags	Marcas de expresión regular. Los valores posibles son: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"
group	Ordinal de base cero del grupo coincidente en el patrón de expresión regular que se va a extraer en tokens. Use -1 si desea usar todo el patrón para dividir la entrada en tokens, independientemente de los grupos coincidentes. El valor predeterminado es -1. Valor predeterminado: -1.
name	Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
odatatype	Discriminador polimórfico
pattern	Patrón de expresión regular para buscar coincidencias con separadores de token. El valor predeterminado es una expresión que coincide con uno o varios caracteres de espacio en blanco. Valor predeterminado: `\W+`.

Detalles de las propiedades

flags

Marcas de expresión regular. Los valores posibles son: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Valor de propiedad

group

Ordinal de base cero del grupo coincidente en el patrón de expresión regular que se va a extraer en tokens. Use -1 si desea usar todo el patrón para dividir la entrada en tokens, independientemente de los grupos coincidentes. El valor predeterminado es -1. Valor predeterminado: -1.

group?: number

Valor de propiedad

number

name

Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

name: string

Valor de propiedad

string

odatatype

Discriminador polimórfico

odatatype: "#Microsoft.Azure.Search.PatternTokenizer"

Valor de propiedad

"#Microsoft.Azure.Search.PatternTokenizer"

pattern

Patrón de expresión regular para buscar coincidencias con separadores de token. El valor predeterminado es una expresión que coincide con uno o varios caracteres de espacio en blanco. Valor predeterminado: \W+.

pattern?: string

Valor de propiedad

string

Compartir a través de

PatternTokenizer interface

Propiedades

Detalles de las propiedades

flags

Valor de propiedad

group

Valor de propiedad

name

Valor de propiedad

odatatype

Valor de propiedad

pattern

Valor de propiedad