Udostępnij przez


PatternAnalyzer interface

Elastycznie oddziela tekst na terminy za pomocą wzorca wyrażenia regularnego. Ten analizator jest implementowany przy użyciu platformy Apache Lucene.

Właściwości

flags

Flagi wyrażeń regularnych. Możliwe wartości to: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

lowerCaseTerms

Wartość wskazująca, czy terminy powinny być małe litery. Wartość domyślna to true. Wartość domyślna: true.

name

Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

odatatype

Dyskryminujący polimorficzny

pattern

Wzorzec wyrażenia regularnego odpowiadający separatorom tokenów. Wartość domyślna to wyrażenie zgodne z co najmniej jednym znakiem odstępu. Wartość domyślna: \W+.

stopwords

Lista stopwords.

Szczegóły właściwości

flags

Flagi wyrażeń regularnych. Możliwe wartości to: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Wartość właściwości

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

lowerCaseTerms

Wartość wskazująca, czy terminy powinny być małe litery. Wartość domyślna to true. Wartość domyślna: true.

lowerCaseTerms?: boolean

Wartość właściwości

boolean

name

Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

name: string

Wartość właściwości

string

odatatype

Dyskryminujący polimorficzny

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

Wartość właściwości

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

Wzorzec wyrażenia regularnego odpowiadający separatorom tokenów. Wartość domyślna to wyrażenie zgodne z co najmniej jednym znakiem odstępu. Wartość domyślna: \W+.

pattern?: string

Wartość właściwości

string

stopwords

Lista stopwords.

stopwords?: string[]

Wartość właściwości

string[]