다음을 통해 공유


PatternAnalyzer interface

정규식 패턴을 통해 텍스트를 용어로 유연하게 구분합니다. 이 분석기는 Apache Lucene을 사용하여 구현됩니다.

속성

flags

정규식 플래그입니다. 가능한 값은 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'입니다.

lowerCaseTerms

용어가 소문자여야 하는지 여부를 나타내는 값입니다. 기본값은 true입니다. 기본값: true.

name

분석기의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 포함해야 하며 영숫자 문자로만 시작하고 끝낼 수 있으며 128자로 제한됩니다.

odatatype

다형 판별자

pattern

토큰 구분 기호와 일치하는 정규식 패턴입니다. 기본값은 하나 이상의 공백 문자와 일치하는 식입니다. 기본값: \W+.

stopwords

중지 단어 목록입니다.

속성 세부 정보

flags

정규식 플래그입니다. 가능한 값은 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'입니다.

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

속성 값

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

lowerCaseTerms

용어가 소문자여야 하는지 여부를 나타내는 값입니다. 기본값은 true입니다. 기본값: true.

lowerCaseTerms?: boolean

속성 값

boolean

name

분석기의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 포함해야 하며 영숫자 문자로만 시작하고 끝낼 수 있으며 128자로 제한됩니다.

name: string

속성 값

string

odatatype

다형 판별자

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

속성 값

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

토큰 구분 기호와 일치하는 정규식 패턴입니다. 기본값은 하나 이상의 공백 문자와 일치하는 식입니다. 기본값: \W+.

pattern?: string

속성 값

string

stopwords

중지 단어 목록입니다.

stopwords?: string[]

속성 값

string[]