CustomAnalyzer interface
Vous permet de contrôler le processus de conversion de texte en jetons indexables/pouvant faire l’objet d’une recherche. Il s’agit d’une configuration définie par l’utilisateur composée d’un seul tokenizer prédéfini et d’un ou plusieurs filtres. Le générateur de jetons est chargé de diviser le texte en jetons et les filtres pour modifier les jetons émis par le tokenizer.
Propriétés
| char |
Liste des filtres de caractères utilisés pour préparer le texte d’entrée avant qu’il ne soit traité par le tokenizer. Par exemple, ils peuvent remplacer certains caractères ou symboles. Les filtres sont exécutés dans l’ordre dans lequel ils sont répertoriés. |
| name | Nom de l’analyseur. Il ne doit contenir que des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement, ne peut commencer et se terminer que par des caractères alphanumériques et est limité à 128 caractères. |
| odatatype | Discriminateur polymorphe |
| token |
Liste des filtres de jetons utilisés pour filtrer ou modifier les jetons générés par un tokenizer. Par exemple, vous pouvez spécifier un filtre en minuscules qui convertit tous les caractères en minuscules. Les filtres sont exécutés dans l’ordre dans lequel ils sont répertoriés. |
| tokenizer |
Nom du générateur de jetons à utiliser pour diviser le texte continu en une séquence de jetons, par exemple en cassant une phrase en mots. KnownTokenizerNames est une énumération contenant des noms de tokenizer intégrés. |
Détails de la propriété
charFilters
Liste des filtres de caractères utilisés pour préparer le texte d’entrée avant qu’il ne soit traité par le tokenizer. Par exemple, ils peuvent remplacer certains caractères ou symboles. Les filtres sont exécutés dans l’ordre dans lequel ils sont répertoriés.
charFilters?: string[]
Valeur de propriété
string[]
name
Nom de l’analyseur. Il ne doit contenir que des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement, ne peut commencer et se terminer que par des caractères alphanumériques et est limité à 128 caractères.
name: string
Valeur de propriété
string
odatatype
Discriminateur polymorphe
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
Valeur de propriété
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
Liste des filtres de jetons utilisés pour filtrer ou modifier les jetons générés par un tokenizer. Par exemple, vous pouvez spécifier un filtre en minuscules qui convertit tous les caractères en minuscules. Les filtres sont exécutés dans l’ordre dans lequel ils sont répertoriés.
tokenFilters?: string[]
Valeur de propriété
string[]
tokenizerName
Nom du générateur de jetons à utiliser pour diviser le texte continu en une séquence de jetons, par exemple en cassant une phrase en mots. KnownTokenizerNames est une énumération contenant des noms de tokenizer intégrés.
tokenizerName: string
Valeur de propriété
string