共用方式為


PatternTokenizer interface

使用 regex 模式比對來建構不同令牌的 Tokenizer。 這個 Tokenizer 是使用 Apache Lucene 實作。

屬性

flags

正則表達式旗標。 可能的值包括:'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES'

group

正則表達式模式中相符群組的以零起始序數,以擷取至標記。 如果您想要使用整個模式將輸入分割成令牌,不論相符群組為何,請使用 -1。 預設值為 -1。 默認值:-1。

name

Tokenizer 的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。

odatatype

多型歧視性

pattern

符合標記分隔符的正則表達式模式。 預設值是符合一或多個空格符的表達式。 預設值:\W+

屬性詳細資料

flags

正則表達式旗標。 可能的值包括:'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES'

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

屬性值

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

group

正則表達式模式中相符群組的以零起始序數,以擷取至標記。 如果您想要使用整個模式將輸入分割成令牌,不論相符群組為何,請使用 -1。 預設值為 -1。 默認值:-1。

group?: number

屬性值

number

name

Tokenizer 的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。

name: string

屬性值

string

odatatype

多型歧視性

odatatype: "#Microsoft.Azure.Search.PatternTokenizer"

屬性值

"#Microsoft.Azure.Search.PatternTokenizer"

pattern

符合標記分隔符的正則表達式模式。 預設值是符合一或多個空格符的表達式。 預設值:\W+

pattern?: string

屬性值

string