CustomAnalyzer interface
可讓您控制將文字轉換成可編製索引/可搜尋令牌的程式。 它是使用者定義的組態,由單一預先定義的Tokenizer和一或多個篩選所組成。 Tokenizer 負責將文字分成令牌,以及修改 Tokenizer 所發出的令牌的篩選條件。
屬性
| char |
令牌化程式處理輸入文字之前,用來準備輸入文字的字元篩選清單。 例如,它們可以取代特定字元或符號。 篩選條件會依列出的順序執行。 |
| name | 分析器的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。 |
| odatatype | 多型歧視性 |
| token |
令牌篩選清單,用來篩選或修改令牌化程式所產生的令牌。 例如,您可以指定將所有字元轉換成小寫的小寫篩選條件。 篩選條件會依列出的順序執行。 |
| tokenizer |
用來將連續文字分割成標記序列的Tokenizer名稱,例如將句子分成單字。 KnownTokenizerNames 是包含內建 Tokenizer 名稱的列舉。 |
屬性詳細資料
charFilters
令牌化程式處理輸入文字之前,用來準備輸入文字的字元篩選清單。 例如,它們可以取代特定字元或符號。 篩選條件會依列出的順序執行。
charFilters?: string[]
屬性值
string[]
name
分析器的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。
name: string
屬性值
string
odatatype
多型歧視性
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
屬性值
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
令牌篩選清單,用來篩選或修改令牌化程式所產生的令牌。 例如,您可以指定將所有字元轉換成小寫的小寫篩選條件。 篩選條件會依列出的順序執行。
tokenFilters?: string[]
屬性值
string[]
tokenizerName
用來將連續文字分割成標記序列的Tokenizer名稱,例如將句子分成單字。 KnownTokenizerNames 是包含內建 Tokenizer 名稱的列舉。
tokenizerName: string
屬性值
string