PatternAnalyzer interface
彈性地透過正則表示式模式將文字分隔成字詞。 此分析器是使用 Apache Lucene 實作的。
屬性
| flags | 正則表達式旗標。 可能的值包括:'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES' |
| lower |
值,指出字詞是否應該小寫。 默認值為 true。 默認值:true。 |
| name | 分析器的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。 |
| odatatype | 多型歧視性 |
| pattern | 符合標記分隔符的正則表達式模式。 預設值是符合一或多個空格符的表達式。 預設值: |
| stopwords | 停用字詞清單。 |
屬性詳細資料
flags
正則表達式旗標。 可能的值包括:'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES'
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
屬性值
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
lowerCaseTerms
值,指出字詞是否應該小寫。 默認值為 true。 默認值:true。
lowerCaseTerms?: boolean
屬性值
boolean
name
分析器的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。
name: string
屬性值
string
odatatype
多型歧視性
odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"
屬性值
"#Microsoft.Azure.Search.PatternAnalyzer"
pattern
符合標記分隔符的正則表達式模式。 預設值是符合一或多個空格符的表達式。 預設值:\W+。
pattern?: string
屬性值
string
stopwords
停用字詞清單。
stopwords?: string[]
屬性值
string[]