EdgeNGramTokenizer interface
Tokenise l’entrée d’un bord en n-grammes de la ou des tailles données. Ce tokenizer est implémenté à l’aide d’Apache Lucene.
- Extends
Propriétés
| max |
Longueur maximale de n-gramme. La valeur par défaut est 2. La valeur maximale est de 300. |
| min |
Longueur minimale de n-gramme. La valeur par défaut est 1. La valeur maximale est de 300. Doit être inférieur à la valeur de maxGram. |
| odatatype | Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être |
| token |
Classes de caractères à conserver dans les jetons. |
Propriétés héritées
| name | Nom du tokenizer. Il ne doit contenir que des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement, ne peut commencer et se terminer que par des caractères alphanumériques et est limité à 128 caractères. |
Détails de la propriété
maxGram
Longueur maximale de n-gramme. La valeur par défaut est 2. La valeur maximale est de 300.
maxGram?: number
Valeur de propriété
number
minGram
Longueur minimale de n-gramme. La valeur par défaut est 1. La valeur maximale est de 300. Doit être inférieur à la valeur de maxGram.
minGram?: number
Valeur de propriété
number
odatatype
Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être
odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"
Valeur de propriété
"#Microsoft.Azure.Search.EdgeNGramTokenizer"
tokenChars
Classes de caractères à conserver dans les jetons.
tokenChars?: TokenCharacterKind[]
Valeur de propriété
Détails de la propriété héritée
name
Nom du tokenizer. Il ne doit contenir que des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement, ne peut commencer et se terminer que par des caractères alphanumériques et est limité à 128 caractères.
name: string
Valeur de propriété
string
héritée deBaseLexicalTokenizer.name