다음을 통해 공유


NGramTokenizer interface

입력을 지정된 크기의 n-gram으로 토큰화합니다. 이 토크나이저는 Apache Lucene을 사용하여 구현됩니다.

Extends

속성

maxGram

최대 n-그램 길이입니다. 기본값은 2입니다. 최대값은 300입니다.

minGram

최소 n-그램 길이입니다. 기본값은 1입니다. 최대값은 300입니다. maxGram 값보다 작아야 합니다.

odatatype

이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

tokenChars

토큰에 유지할 문자 클래스입니다.

상속된 속성

name

tokenizer의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 포함해야 하며 영숫자 문자로만 시작하고 끝낼 수 있으며 128자로 제한됩니다.

속성 세부 정보

maxGram

최대 n-그램 길이입니다. 기본값은 2입니다. 최대값은 300입니다.

maxGram?: number

속성 값

number

minGram

최소 n-그램 길이입니다. 기본값은 1입니다. 최대값은 300입니다. maxGram 값보다 작아야 합니다.

minGram?: number

속성 값

number

odatatype

이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

속성 값

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

토큰에 유지할 문자 클래스입니다.

tokenChars?: TokenCharacterKind[]

속성 값

상속된 속성 세부 정보

name

tokenizer의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 포함해야 하며 영숫자 문자로만 시작하고 끝낼 수 있으며 128자로 제한됩니다.

name: string

속성 값

string

LexicalTokenizer.name 에서 상속됨