Udostępnij przez


CustomAnalyzer interface

Umożliwia przejęcie kontroli nad procesem konwertowania tekstu na tokeny z możliwością indeksowania/wyszukiwania. Jest to konfiguracja zdefiniowana przez użytkownika składająca się z jednego wstępnie zdefiniowanego tokenizera i co najmniej jednego filtru. Tokenizer jest odpowiedzialny za podzielenie tekstu na tokeny i filtry modyfikowania tokenów emitowanych przez tokenizatora.

Właściwości

charFilters

Lista filtrów znaków używanych do przygotowywania tekstu wejściowego przed jego przetworzeniem przez tokenizatora. Mogą na przykład zastąpić niektóre znaki lub symbole. Filtry są uruchamiane w kolejności, w której są wyświetlane.

name

Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

odatatype

Dyskryminujący polimorficzny

tokenFilters

Lista filtrów tokenów używanych do filtrowania lub modyfikowania tokenów wygenerowanych przez tokenizator. Można na przykład określić filtr małych liter, który konwertuje wszystkie znaki na małe litery. Filtry są uruchamiane w kolejności, w której są wyświetlane.

tokenizerName

Nazwa tokenizatora używanego do dzielenia tekstu ciągłego na sekwencję tokenów, na przykład dzielenie zdania na wyrazy. KnownTokenizerNames to wyliczenie zawierające wbudowane nazwy tokenizatorów.

Szczegóły właściwości

charFilters

Lista filtrów znaków używanych do przygotowywania tekstu wejściowego przed jego przetworzeniem przez tokenizatora. Mogą na przykład zastąpić niektóre znaki lub symbole. Filtry są uruchamiane w kolejności, w której są wyświetlane.

charFilters?: string[]

Wartość właściwości

string[]

name

Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

name: string

Wartość właściwości

string

odatatype

Dyskryminujący polimorficzny

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Wartość właściwości

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Lista filtrów tokenów używanych do filtrowania lub modyfikowania tokenów wygenerowanych przez tokenizator. Można na przykład określić filtr małych liter, który konwertuje wszystkie znaki na małe litery. Filtry są uruchamiane w kolejności, w której są wyświetlane.

tokenFilters?: string[]

Wartość właściwości

string[]

tokenizerName

Nazwa tokenizatora używanego do dzielenia tekstu ciągłego na sekwencję tokenów, na przykład dzielenie zdania na wyrazy. KnownTokenizerNames to wyliczenie zawierające wbudowane nazwy tokenizatorów.

tokenizerName: string

Wartość właściwości

string