Skillsets - Create
검색 서비스에서 새 기술 세트를 만듭니다.
POST {endpoint}/skillsets?api-version=2025-09-01
URI 매개 변수
| Name | In(다음 안에) | 필수 | 형식 | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
검색 서비스의 엔드포인트 URL입니다. |
|
api-version
|
query | True |
string |
클라이언트 API 버전입니다. |
요청 헤더
| Name | 필수 | 형식 | Description |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
디버깅을 돕기 위해 요청과 함께 전송된 추적 ID입니다. |
요청 본문
| Name | 필수 | 형식 | Description |
|---|---|---|---|
| name | True |
string |
기술 세트의 이름입니다. |
| skills | True |
SearchIndexerSkill[]:
|
기술 세트의 기술 목록입니다. |
| @odata.etag |
string |
기술 세트의 ETag입니다. |
|
| cognitiveServices | CognitiveServicesAccount: |
기술을 실행할 때 사용할 Azure AI 서비스에 대한 세부 정보입니다. |
|
| description |
string |
기술 세트에 대한 설명입니다. |
|
| encryptionKey |
Azure Key Vault에서 만드는 암호화 키에 대한 설명입니다. 이 키는 Microsoft를 포함한 누구도 기술 세트 정의의 암호를 해독할 수 없다는 완전한 확신을 원하는 경우 기술 집합 정의에 대한 추가 수준의 미사용 암호화를 제공하는 데 사용됩니다. 기술 세트 정의를 암호화하면 항상 암호화된 상태로 유지됩니다. 검색 서비스는 이 속성을 null로 설정하려는 시도를 무시합니다. 암호화 키를 순환하려는 경우 필요에 따라 이 속성을 변경할 수 있습니다. 기술 세트 정의는 영향을 받지 않습니다. 고객 관리형 키를 사용한 암호화는 무료 검색 서비스에서 사용할 수 없으며 2019년 1월 1일 이후에 생성된 유료 서비스에서만 사용할 수 있습니다. |
||
| indexProjections |
2차 검색 인덱스에 대한 추가 프로젝션의 정의. |
||
| knowledgeStore |
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션을 정의합니다. |
응답
| Name | 형식 | Description |
|---|---|---|
| 201 Created |
기술 세트가 성공적으로 만들어졌습니다. |
|
| Other Status Codes |
오류 응답입니다. |
예제
SearchServiceCreateSkillset
샘플 요청
POST https://stableexampleservice.search.windows.net/skillsets?api-version=2025-09-01
{
"name": "tempskillset",
"description": "Skillset for extracting entities and more",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "skill2",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"textSplitMode": "pages",
"maximumPageLength": 4000,
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "skill3",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "skill4",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"uri": "https://contoso.example.org/",
"httpMethod": "POST",
"timeout": "PT5S",
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "skill5",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
]
},
{
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill",
"context": "/document",
"inputs": [
{
"name": "file_data",
"source": "/document/content"
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
},
{
"outputFormat": "text",
"outputMode": "oneToMany",
"extractionOptions": [
"images",
"locationMetadata"
],
"chunkingProperties": {
"unit": "characters",
"maximumLength": 500,
"overlapLength": 50
},
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill#2",
"context": "/document",
"inputs": [
{
"name": "file_data",
"source": "/document/content"
}
],
"outputs": [
{
"name": "text_sections",
"targetName": "text_sections"
},
{
"name": "normalized_images",
"targetName": "normalized_images"
}
]
}
],
"cognitiveServices": {
"@odata.type": "#Microsoft.Azure.Search.DefaultCognitiveServices",
"description": "Description of the Azure AI service resource attached to a skillset"
},
"@odata.etag": "0x1234568AE7E58A1"
}
샘플 응답
{
"@odata.etag": "0x1234568AE7E58A1",
"name": "tempskillset",
"description": "Skillset for extracting entities and more",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "skill2",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "countryHint",
"source": "/document/countryHint",
"inputs": []
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "skill3",
"textSplitMode": "pages",
"maximumPageLength": 4000,
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "skill4",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "skill5",
"uri": "https://contoso.example.org/",
"httpMethod": "POST",
"timeout": "PT5S",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"extractionOptions": [],
"inputs": [
{
"name": "file_data",
"source": "/document/content",
"inputs": []
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill#2",
"context": "/document",
"outputMode": "oneToMany",
"outputFormat": "text",
"extractionOptions": [
"images",
"locationMetadata"
],
"inputs": [
{
"name": "file_data",
"source": "/document/content",
"inputs": []
}
],
"outputs": [
{
"name": "text_sections",
"targetName": "text_sections"
},
{
"name": "normalized_images",
"targetName": "normalized_images"
}
],
"chunkingProperties": {
"unit": "characters",
"maximumLength": 500,
"overlapLength": 50
}
}
],
"cognitiveServices": {
"@odata.type": "#Microsoft.Azure.Search.DefaultCognitiveServices",
"description": "Description of the Azure AI service resource attached to a skillset"
}
}
정의
| Name | Description |
|---|---|
|
Azure |
Azure Key Vault에 저장된 암호화 키에 대한 인증된 액세스에 사용되는 검색 서비스에 대해 만든 등록된 애플리케이션의 자격 증명입니다. |
|
Azure |
Azure OpenAI 리소스를 사용하여 지정된 텍스트 입력에 대한 벡터 포함을 생성할 수 있습니다. |
|
Azure |
호출될 Azure Open AI 모델 이름입니다. |
|
Cognitive |
기술 집합에 연결된 Azure AI 서비스 리소스의 다중 지역 계정 키입니다. |
|
Conditional |
부울 연산이 필요한 시나리오에서 출력에 할당할 데이터를 결정할 수 있도록 하는 기술입니다. |
|
Custom |
발견된 일치 항목 및 관련 메타데이터에 대한 정보를 포함하는 개체입니다. |
|
Custom |
루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복잡한 개체입니다. |
|
Custom |
기술은 사용자 정의 단어 및 구문의 사용자 정의 목록에서 텍스트를 찾습니다. |
|
Custom |
CustomEntityLookupSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다. |
|
Default |
기술 집합에 대한 기본 Azure AI 서비스 리소스를 나타내는 빈 개체입니다. |
|
Document |
보강 파이프라인 내의 파일에서 콘텐츠를 추출하는 기술입니다. |
|
Document |
보강 파이프라인 내의 파일에서 Azure AI Services를 통해 콘텐츠 및 레이아웃 정보를 추출하는 기술입니다. |
|
Document |
콘텐츠를 청크하기 위한 카디널리티를 제어합니다. |
|
Document |
청크 단위의 카디널리티를 제어합니다. 기본값은 '문자'입니다. |
|
Document |
스킬에 의해 문서에서 추출된 콘텐츠의 카디널리티를 제어합니다. |
|
Document |
마크다운 출력의 헤더 깊이입니다. 기본값은 h6입니다. |
|
Document |
출력 형식의 카디널리티를 제어합니다. 기본값은 'markdown'입니다. |
|
Document |
기술에 의해 생성된 출력의 카디널리티를 제어합니다. 기본값은 'oneToMany'입니다. |
|
Entity |
반환할 엔터티 범주를 나타내는 문자열입니다. |
|
Entity |
Text Analytics API를 사용하여 텍스트에서 연결된 엔터티를 추출합니다. |
|
Entity |
이 기술은 더 이상 사용되지 않습니다. V3를 사용하십시오. EntityRecognitionSkill을 사용합니다. |
|
Entity |
Deprecated. EntityRecognitionSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다. |
|
Entity |
Text Analytics API를 사용하여 텍스트에서 다양한 형식의 엔터티를 추출합니다. |
|
Error |
리소스 관리 오류 추가 정보입니다. |
|
Error |
오류 세부 정보입니다. |
|
Error |
오류 응답 |
|
Image |
이미지 파일을 분석하는 스킬입니다. 이미지 콘텐츠를 기반으로 풍부한 시각적 기능 세트를 추출합니다. |
|
Image |
ImageAnalysisSkill에서 입력할 수 있도록 지원되는 언어 코드입니다. |
|
Image |
반환할 도메인별 세부 정보를 나타내는 문자열입니다. |
|
Index |
인덱서의 나머지 부분과 관련된 인덱스 프로젝션의 동작을 정의합니다. |
|
Input |
스킬에 대한 입력 필드 매핑입니다. |
|
Key |
핵심 구 추출에 텍스트 분석을 사용하는 기술입니다. |
|
Key |
KeyPhraseExtractionSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다. |
|
Language |
입력 텍스트의 언어를 감지하고 요청에 제출된 모든 문서에 대해 단일 언어 코드를 보고하는 스킬입니다. 언어 코드는 분석의 신뢰도를 나타내는 점수와 쌍을 이룹니다. |
|
Line |
OCR 스킬에서 인식하는 텍스트 줄 사이에 사용할 문자 순서를 정의합니다. 기본값은 "space"입니다. |
|
Merge |
두 개 이상의 문자열을 단일 통합 문자열로 병합하는 기술로, 각 구성 요소 부분을 구분하는 선택적 사용자 정의 구분 기호를 사용합니다. |
|
Ocr |
이미지 파일에서 텍스트를 추출하는 스킬입니다. |
|
Ocr |
OcrSkill에서 입력할 수 있도록 지원되는 언어 코드입니다. |
|
Output |
스킬에 대한 출력 필드 매핑입니다. |
|
PIIDetection |
Text Analytics API를 사용하여 입력 텍스트에서 개인 정보를 추출하고 마스킹 옵션을 제공합니다. |
|
PIIDetection |
입력 텍스트에서 검색된 개인 정보를 마스킹하는 데 사용할 maskingMode를 나타내는 문자열입니다. |
|
Search |
데이터 원본의 ID 속성을 지웁니다. |
|
Search |
사용할 데이터 원본의 ID를 지정합니다. |
|
Search |
보조 검색 인덱스에 대한 추가 프로젝션의 정의입니다. |
|
Search |
지정된 검색 인덱스에 저장할 데이터에 대한 설명입니다. |
|
Search |
인덱스 프로젝션별 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다. |
|
Search |
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션을 정의합니다. |
|
Search |
Azure Files에 저장할 데이터에 대한 프로젝션 정의입니다. |
|
Search |
Azure Blob에 저장할 데이터에 대한 프로젝션 정의입니다. |
|
Search |
다양한 프로젝션 선택기에 대한 컨테이너 개체입니다. |
|
Search |
Azure Tables에 저장할 데이터에 대한 설명입니다. |
|
Search |
기술 목록입니다. |
|
Search |
Azure Key Vault의 고객 관리형 암호화 키입니다. 만들고 관리하는 키를 사용하여 인덱스 및 동의어 맵과 같은 미사용 데이터를 암호화하거나 복호화할 수 있습니다. |
|
Sentiment |
이 기술은 더 이상 사용되지 않습니다. V3를 사용하십시오. SentimentSkill을 사용합니다. |
|
Sentiment |
Deprecated. SentimentSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다. |
|
Sentiment |
Text Analytics API를 사용하여 구조화되지 않은 텍스트를 평가하고 각 레코드에 대해 문장 및 문서 수준에서 서비스에서 찾은 가장 높은 신뢰도 점수를 기반으로 감정 레이블(예: "부정적", "중립적" 및 "긍정적")을 제공합니다. |
|
Shaper |
출력을 재구성하는 기술입니다. 복합 필드(다중 파트 필드라고도 함)를 지원하는 복합 형식을 만듭니다. |
|
Split |
문자열을 텍스트 덩어리로 분할하는 기술입니다. |
|
Split |
SplitSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다. |
|
Text |
수행할 분할 모드를 나타내는 값입니다. |
|
Text |
텍스트를 한 언어에서 다른 언어로 번역하는 기술입니다. |
|
Text |
TextTranslationSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다. |
|
Visual |
반환할 시각적 기능 유형을 나타내는 문자열입니다. |
|
Web |
Web API 엔드포인트를 호출할 수 있는 기술로, 사용자 지정 코드를 호출하여 기술 세트를 확장할 수 있습니다. |
AzureActiveDirectoryApplicationCredentials
Azure Key Vault에 저장된 암호화 키에 대한 인증된 액세스에 사용되는 검색 서비스에 대해 만든 등록된 애플리케이션의 자격 증명입니다.
| Name | 형식 | Description |
|---|---|---|
| applicationId |
string |
미사용 데이터를 암호화할 때 사용할 Azure Key Vault에 필요한 액세스 권한이 부여된 AAD 애플리케이션 ID입니다. 애플리케이션 ID를 AAD 애플리케이션의 개체 ID와 혼동해서는 안 됩니다. |
| applicationSecret |
string |
지정된 AAD 애플리케이션의 인증 키입니다. |
AzureOpenAIEmbeddingSkill
Azure OpenAI 리소스를 사용하여 지정된 텍스트 입력에 대한 벡터 포함을 생성할 수 있습니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| apiKey |
string |
지정된 Azure OpenAI 리소스의 API 키입니다. |
| authIdentity | SearchIndexerDataIdentity: |
아웃바운드 연결에 사용되는 사용자 할당 관리 ID입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| deploymentId |
string |
지정된 리소스에 대한 Azure OpenAI 모델 배포의 ID입니다. |
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| dimensions |
integer (int32) |
결과 출력 포함에 있어야 하는 차원의 수입니다. text-embedding-3 이상 모델에서만 지원됩니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| modelName |
제공된 deploymentId 경로에 배포되는 포함 모델의 이름입니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
|
| resourceUri |
string (uri) |
Azure OpenAI 리소스의 리소스 URI입니다. |
AzureOpenAIModelName
호출될 Azure Open AI 모델 이름입니다.
| 값 | Description |
|---|---|
| text-embedding-ada-002 | |
| text-embedding-3-large | |
| text-embedding-3-small |
CognitiveServicesAccountKey
기술 집합에 연결된 Azure AI 서비스 리소스의 다중 지역 계정 키입니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 집합에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다. |
| description |
string |
기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다. |
| key |
string |
기술 세트에 연결된 Azure AI 서비스 리소스를 프로비전하는 데 사용되는 키입니다. |
ConditionalSkill
부울 연산이 필요한 시나리오에서 출력에 할당할 데이터를 결정할 수 있도록 하는 기술입니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
CustomEntity
발견된 일치 항목 및 관련 메타데이터에 대한 정보를 포함하는 개체입니다.
| Name | 형식 | Description |
|---|---|---|
| accentSensitive |
boolean |
기본값은 false입니다. 엔터티 이름과의 비교가 악센트에 민감해야 하는지 여부를 나타내는 부울 값입니다. |
| aliases |
루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복잡한 개체의 배열입니다. |
|
| caseSensitive |
boolean |
기본값은 false입니다. 엔터티 이름과의 비교가 문자 대/소문자에 민감해야 하는지 여부를 나타내는 부울 값입니다. "Microsoft"의 대/소문자를 구분하지 않는 샘플 일치는 microsoft, microSoft, MICROSOFT일 수 있습니다. |
| defaultAccentSensitive |
boolean |
이 엔터티에 대한 기본 악센트 민감도 값을 변경합니다. 모든 별칭 accentSensitive 값의 기본값을 변경하는 데 사용됩니다. |
| defaultCaseSensitive |
boolean |
이 엔터티의 기본 대/소문자 구분 값을 변경합니다. 모든 별칭의 기본값을 변경하는 데 사용됩니다. |
| defaultFuzzyEditDistance |
integer (int32) |
이 엔티티에 대한 기본 퍼지 편집 거리 값을 변경합니다. 모든 별칭 fuzzyEditDistance 값의 기본값을 변경하는 데 사용할 수 있습니다. |
| description |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터에 대한 패스스루로 사용할 수 있습니다. 이 필드의 값은 스킬 출력에서 해당 엔티티의 모든 일치와 함께 나타납니다. |
| fuzzyEditDistance |
integer (int32) |
기본값은 0입니다. 최대값은 5입니다. 엔터티 이름과 일치하는 것으로 간주되는 허용되는 발산 문자 수를 나타냅니다. 지정된 일치 항목에 대해 가능한 가장 작은 퍼지가 반환됩니다. 예를 들어 편집 거리가 3으로 설정된 경우 "Windows10"은 여전히 "Windows", "Windows10" 및 "Windows 7"과 일치합니다. 대소문자 구분이 false로 설정되면 대소문자 차이는 퍼지 허용 오차에 포함되지 않지만 그렇지 않으면 계산됩니다. |
| id |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터에 대한 패스스루로 사용할 수 있습니다. 이 필드의 값은 스킬 출력에서 해당 엔티티의 모든 일치와 함께 나타납니다. |
| name |
string |
최상위 엔터티 설명자입니다. 스킬 출력의 일치 항목은 이 이름으로 그룹화되며 발견되는 텍스트의 "정규화된" 형식을 나타내야 합니다. |
| subtype |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터에 대한 패스스루로 사용할 수 있습니다. 이 필드의 값은 스킬 출력에서 해당 엔티티의 모든 일치와 함께 나타납니다. |
| type |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터에 대한 패스스루로 사용할 수 있습니다. 이 필드의 값은 스킬 출력에서 해당 엔티티의 모든 일치와 함께 나타납니다. |
CustomEntityAlias
루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복잡한 개체입니다.
| Name | 형식 | Description |
|---|---|---|
| accentSensitive |
boolean |
별칭이 악센트를 구분하는지 확인합니다. |
| caseSensitive |
boolean |
별칭이 대/소문자를 구분하는지 확인합니다. |
| fuzzyEditDistance |
integer (int32) |
별칭의 퍼지 편집 거리를 결정합니다. |
| text |
string |
별칭의 텍스트입니다. |
CustomEntityLookupSkill
기술은 사용자 정의 단어 및 구문의 사용자 정의 목록에서 텍스트를 찾습니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| entitiesDefinitionUri |
string |
일치시킬 모든 대상 텍스트가 포함된 JSON 또는 CSV 파일의 경로입니다. 이 엔터티 정의는 인덱서 실행을 시작할 때 읽습니다. 인덱서 실행 중 이 파일에 대한 업데이트는 후속 실행까지 적용되지 않습니다. 이 구성은 HTTPS를 통해 액세스할 수 있어야 합니다. |
| globalDefaultAccentSensitive |
boolean |
AccentSensitive의 전역 플래그입니다. AccentSensitive가 CustomEntity에 설정되지 않은 경우 이 값이 기본값이 됩니다. |
| globalDefaultCaseSensitive |
boolean |
CaseSensitive의 전역 플래그입니다. CustomEntity에서 CaseSensitive가 설정되지 않은 경우 이 값이 기본값이 됩니다. |
| globalDefaultFuzzyEditDistance |
integer (int32) |
FuzzyEditDistance의 전역 플래그입니다. FuzzyEditDistance가 CustomEntity에 설정되지 않은 경우 이 값이 기본값이 됩니다. |
| inlineEntitiesDefinition |
인라인 CustomEntity 정의입니다. |
|
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
CustomEntityLookupSkillLanguage
CustomEntityLookupSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다.
| 값 | Description |
|---|---|
| da |
덴마크어 |
| de |
German |
| en |
English |
| es |
Spanish |
| fi |
핀란드어 |
| fr |
French |
| it |
Italian |
| ko |
한국어 |
| pt |
포르투갈어 |
DefaultCognitiveServicesAccount
기술 집합에 대한 기본 Azure AI 서비스 리소스를 나타내는 빈 개체입니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 집합에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다. |
| description |
string |
기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다. |
DocumentExtractionSkill
보강 파이프라인 내의 파일에서 콘텐츠를 추출하는 기술입니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| configuration |
object |
스킬에 대한 구성의 사전입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| dataToExtract |
string |
스킬에 대해 추출할 데이터 유형입니다. 정의되지 않은 경우 'contentAndMetadata'로 설정됩니다. |
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
|
| parsingMode |
string |
스킬에 대한 parsingMode입니다. 정의되지 않은 경우 'default'로 설정됩니다. |
DocumentIntelligenceLayoutSkill
보강 파이프라인 내의 파일에서 Azure AI Services를 통해 콘텐츠 및 레이아웃 정보를 추출하는 기술입니다.
| Name | 형식 | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
| chunkingProperties |
콘텐츠를 청크하기 위한 카디널리티를 제어합니다. |
||
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
|
| extractionOptions |
스킬에 의해 문서에서 추출된 콘텐츠의 카디널리티를 제어합니다 |
||
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
||
| markdownHeaderDepth | h6 |
마크다운 출력의 헤더 깊이입니다. 기본값은 h6입니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
|
| outputFormat | markdown |
출력 형식의 카디널리티를 제어합니다. 기본값은 'markdown'입니다. |
|
| outputMode | oneToMany |
기술에 의해 생성된 출력의 카디널리티를 제어합니다. 기본값은 'oneToMany'입니다. |
|
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
DocumentIntelligenceLayoutSkillChunkingProperties
콘텐츠를 청크하기 위한 카디널리티를 제어합니다.
| Name | 형식 | Default value | Description |
|---|---|---|---|
| maximumLength |
integer (int32) |
최대 청크 길이(문자)입니다. 기본값은 500입니다. |
|
| overlapLength |
integer (int32) |
두 텍스트 청크 사이에 제공되는 겹침의 길이입니다. 기본값은 0입니다. |
|
| unit | characters |
청크의 단위입니다. |
DocumentIntelligenceLayoutSkillChunkingUnit
청크 단위의 카디널리티를 제어합니다. 기본값은 '문자'입니다.
| 값 | Description |
|---|---|
| characters |
문자로 청크를 지정합니다. |
DocumentIntelligenceLayoutSkillExtractionOptions
스킬에 의해 문서에서 추출된 콘텐츠의 카디널리티를 제어합니다.
| 값 | Description |
|---|---|
| images |
문서에서 이미지 콘텐츠를 추출하도록 지정합니다. |
| locationMetadata |
문서에서 위치 메타데이터를 추출하도록 지정합니다. |
DocumentIntelligenceLayoutSkillMarkdownHeaderDepth
마크다운 출력의 헤더 깊이입니다. 기본값은 h6입니다.
| 값 | Description |
|---|---|
| h1 |
헤더 수준 1. |
| h2 |
헤더 수준 2. |
| h3 |
헤더 수준 3. |
| h4 |
헤더 수준 4. |
| h5 |
헤더 수준 5. |
| h6 |
헤더 수준 6. |
DocumentIntelligenceLayoutSkillOutputFormat
출력 형식의 카디널리티를 제어합니다. 기본값은 'markdown'입니다.
| 값 | Description |
|---|---|
| text |
출력의 형식을 텍스트로 지정합니다. |
| markdown |
출력 형식을 마크다운으로 지정합니다. |
DocumentIntelligenceLayoutSkillOutputMode
기술에 의해 생성된 출력의 카디널리티를 제어합니다. 기본값은 'oneToMany'입니다.
| 값 | Description |
|---|---|
| oneToMany |
출력을 'oneToMany'로 구문 분석하도록 지정합니다. |
EntityCategory
반환할 엔터티 범주를 나타내는 문자열입니다.
| 값 | Description |
|---|---|
| location |
물리적 위치를 설명하는 엔터티입니다. |
| organization |
조직을 설명하는 엔터티입니다. |
| person |
사람을 설명하는 엔터티입니다. |
| quantity |
수량을 설명하는 엔터티입니다. |
| datetime |
날짜와 시간을 설명하는 엔터티입니다. |
| url |
URL을 설명하는 엔터티입니다. |
|
이메일 주소를 설명하는 엔터티입니다. |
EntityLinkingSkill
Text Analytics API를 사용하여 텍스트에서 연결된 엔터티를 추출합니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| minimumPrecision |
number (double) minimum: 0maximum: 1 |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정되지 않으면(기본값) 명시적으로 null로 설정된 경우 모든 엔터티가 포함됩니다. |
| modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않은 경우 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 꼭 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
EntityRecognitionSkill
이 기술은 더 이상 사용되지 않습니다. V3를 사용하십시오. EntityRecognitionSkill을 사용합니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| categories |
추출해야 하는 엔터티 범주 목록입니다. |
|
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| includeTypelessEntities |
boolean |
잘 알려져 있지만 미리 정의된 형식을 준수하지 않는 엔터티를 포함할지 여부를 결정합니다. 이 구성이 설정되지 않은 경우(기본값), null로 설정하거나 false로 설정하면 미리 정의된 형식 중 하나를 준수하지 않는 엔터티가 표시되지 않습니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| minimumPrecision |
number (double) |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정되지 않으면(기본값) 명시적으로 null로 설정된 경우 모든 엔터티가 포함됩니다. |
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
EntityRecognitionSkillLanguage
Deprecated. EntityRecognitionSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다.
| 값 | Description |
|---|---|
| ar |
Arabic |
| cs |
체코어 |
| zh-Hans |
중국어(간체) |
| zh-Hant |
Chinese-Traditional |
| da |
덴마크어 |
| nl |
네덜란드어 |
| en |
English |
| fi |
핀란드어 |
| fr |
French |
| de |
German |
| el |
그리스어 |
| hu |
Hungarian |
| it |
Italian |
| ja |
Japanese |
| ko |
한국어 |
| no |
노르웨이어(복말) |
| pl |
Polish |
| pt-PT |
포르투갈어(포르투갈) |
| pt-BR |
포르투갈어 (브라질) |
| ru |
Russian |
| es |
Spanish |
| sv |
스웨덴어 |
| tr |
터키어 |
EntityRecognitionSkillV3
Text Analytics API를 사용하여 텍스트에서 다양한 형식의 엔터티를 추출합니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| categories |
string[] |
추출해야 하는 엔터티 범주 목록입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| minimumPrecision |
number (double) minimum: 0maximum: 1 |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정되지 않으면(기본값) 명시적으로 null로 설정된 경우 모든 엔터티가 포함됩니다. |
| modelVersion |
string |
Text Analytics API를 호출할 때 사용할 모델의 버전입니다. 지정하지 않은 경우 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 꼭 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
ErrorAdditionalInfo
리소스 관리 오류 추가 정보입니다.
| Name | 형식 | Description |
|---|---|---|
| info |
object |
추가 정보입니다. |
| type |
string |
추가 정보 유형입니다. |
ErrorDetail
오류 세부 정보입니다.
| Name | 형식 | Description |
|---|---|---|
| additionalInfo |
오류 추가 정보입니다. |
|
| code |
string |
오류 코드입니다. |
| details |
오류 세부 정보입니다. |
|
| message |
string |
오류 메시지입니다. |
| target |
string |
오류 대상입니다. |
ErrorResponse
오류 응답
| Name | 형식 | Description |
|---|---|---|
| error |
오류 개체입니다. |
ImageAnalysisSkill
이미지 파일을 분석하는 스킬입니다. 이미지 콘텐츠를 기반으로 풍부한 시각적 기능 세트를 추출합니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| details |
반환할 도메인별 세부 정보를 나타내는 문자열입니다. |
|
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
|
| visualFeatures |
시각적 기능 목록입니다. |
ImageAnalysisSkillLanguage
ImageAnalysisSkill에서 입력할 수 있도록 지원되는 언어 코드입니다.
| 값 | Description |
|---|---|
| ar |
Arabic |
| az |
아제르바이잔어 |
| bg |
불가리아어 |
| bs |
보스니아어(라틴 문자) |
| ca |
카탈로니아어 |
| cs |
체코어 |
| cy |
웨일스어 |
| da |
덴마크어 |
| de |
German |
| el |
그리스어 |
| en |
English |
| es |
Spanish |
| et |
Estonian |
| eu |
바스크어 |
| fi |
핀란드어 |
| fr |
French |
| ga |
아일랜드어 |
| gl |
갈리시아어 |
| he |
히브리어 |
| hi |
힌디어 |
| hr |
크로아티아어 |
| hu |
Hungarian |
| id |
Indonesian |
| it |
Italian |
| ja |
Japanese |
| kk |
카자흐어 |
| ko |
한국어 |
| lt |
리투아니아어 |
| lv |
Latvian |
| mk |
마케도니아어 |
| ms |
말레이어(말레이시아) |
| nb |
노르웨이어(복말) |
| nl |
네덜란드어 |
| pl |
Polish |
| prs |
Dari |
| pt-BR |
포르투갈어(브라질) |
| pt |
포르투갈어(포르투갈) |
| pt-PT |
포르투갈어(포르투갈) |
| ro |
루마니아어 |
| ru |
Russian |
| sk |
슬로바키아어 |
| sl |
슬로베니아어 |
| sr-Cyrl |
세르비아어(키릴 문자) |
| sr-Latn |
세르비아어(라틴 문자) |
| sv |
스웨덴어 |
| th |
태국어 |
| tr |
터키어 |
| uk |
우크라이나어 |
| vi |
베트남어 |
| zh |
중국어 간체 |
| zh-Hans |
중국어 간체 |
| zh-Hant |
중국어 번체 |
ImageDetail
반환할 도메인별 세부 정보를 나타내는 문자열입니다.
| 값 | Description |
|---|---|
| celebrities |
연예인으로 인정되는 디테일. |
| landmarks |
세부 사항은 랜드마크로 인식됩니다. |
IndexProjectionMode
인덱서의 나머지 부분과 관련된 인덱스 프로젝션의 동작을 정의합니다.
| 값 | Description |
|---|---|
| skipIndexingParentDocuments |
원본 문서는 인덱서의 대상 인덱스에 쓰는 것을 건너뜁니다. |
| includeIndexingParentDocuments |
원본 문서는 인덱서의 대상 인덱스에 기록됩니다. 기본 패턴입니다. |
InputFieldMappingEntry
스킬에 대한 입력 필드 매핑입니다.
| Name | 형식 | Description |
|---|---|---|
| inputs |
복합 형식을 만들 때 사용되는 재귀 입력입니다. |
|
| name |
string |
입력의 이름입니다. |
| source |
string |
입력의 소스입니다. |
| sourceContext |
string |
재귀 입력을 선택하는 데 사용되는 소스 컨텍스트입니다. |
KeyPhraseExtractionSkill
핵심 구 추출에 텍스트 분석을 사용하는 기술입니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| maxKeyPhraseCount |
integer (int32) |
반환할 핵심 문구 수를 나타내는 숫자입니다. 없는 경우 식별된 모든 핵심 문구가 반환됩니다. |
| modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않은 경우 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 꼭 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
KeyPhraseExtractionSkillLanguage
KeyPhraseExtractionSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다.
| 값 | Description |
|---|---|
| da |
덴마크어 |
| nl |
네덜란드어 |
| en |
English |
| fi |
핀란드어 |
| fr |
French |
| de |
German |
| it |
Italian |
| ja |
Japanese |
| ko |
한국어 |
| no |
노르웨이어(복말) |
| pl |
Polish |
| pt-PT |
포르투갈어(포르투갈) |
| pt-BR |
포르투갈어 (브라질) |
| ru |
Russian |
| es |
Spanish |
| sv |
스웨덴어 |
LanguageDetectionSkill
입력 텍스트의 언어를 감지하고 요청에 제출된 모든 문서에 대해 단일 언어 코드를 보고하는 스킬입니다. 언어 코드는 분석의 신뢰도를 나타내는 점수와 쌍을 이룹니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultCountryHint |
string |
언어의 모호성을 제거할 수 없는 경우 언어 검색 모델에 대한 힌트로 사용할 국가 코드입니다. |
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않은 경우 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 꼭 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
LineEnding
OCR 스킬에서 인식하는 텍스트 줄 사이에 사용할 문자 순서를 정의합니다. 기본값은 "space"입니다.
| 값 | Description |
|---|---|
| space |
줄은 단일 공백 문자로 구분됩니다. |
| carriageReturn |
행은 캐리지 리턴('\r') 문자로 구분됩니다. |
| lineFeed |
줄은 단일 줄 바꿈('\n') 문자로 구분됩니다. |
| carriageReturnLineFeed |
줄은 캐리지 리턴과 줄 바꿈('\r\n') 문자로 구분됩니다. |
MergeSkill
두 개 이상의 문자열을 단일 통합 문자열로 병합하는 기술로, 각 구성 요소 부분을 구분하는 선택적 사용자 정의 구분 기호를 사용합니다.
| Name | 형식 | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
|
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
||
| insertPostTag |
string |
태그는 병합된 텍스트의 끝을 나타냅니다. 기본적으로 태그는 빈 공간입니다. |
|
| insertPreTag |
string |
태그는 병합된 텍스트의 시작을 나타냅니다. 기본적으로 태그는 빈 공간입니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
|
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
OcrSkill
이미지 파일에서 텍스트를 추출하는 스킬입니다.
| Name | 형식 | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
|
| defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
||
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
|
| detectOrientation |
boolean |
False |
방향 감지를 켜거나 켜지 않기를 나타내는 값입니다. 기본값은 false입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
||
| lineEnding |
OCR 스킬에서 인식하는 텍스트 줄 사이에 사용할 문자 순서를 정의합니다. 기본값은 "space"입니다. |
||
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
|
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
OcrSkillLanguage
OcrSkill에서 입력할 수 있도록 지원되는 언어 코드입니다.
| 값 | Description |
|---|---|
| af |
아프리칸스어 |
| sq |
알바니아어 |
| anp |
앙기카어(데바나기리어) |
| ar |
Arabic |
| ast |
아스투리아스어 |
| awa |
Awadhi-Hindi(데바나기리어) |
| az |
아제르바이잔어(라틴어) |
| bfy |
Bagheli |
| eu |
바스크어 |
| be |
벨로루시어(키릴 자모 및 라틴어) |
| be-cyrl |
벨로루시어(키릴 자모) |
| be-latn |
벨로루시어(라틴어) |
| bho |
Bhojpuri-Hindi(데바나기리어) |
| bi |
비슬라마어 |
| brx |
Bodo(데바나기리어) |
| bs |
보스니아어(라틴 문자) |
| bra |
Brajbha |
| br |
브르타뉴어 |
| bg |
불가리아어 |
| bns |
Bundeli |
| bua |
부랴트어(키릴 자모) |
| ca |
카탈로니아어 |
| ceb |
세부아노어 |
| rab |
Chamling |
| ch |
차모로어 |
| hne |
Chhattisgarhi(데바나기리어) |
| zh-Hans |
중국어 간체 |
| zh-Hant |
중국어 번체 |
| kw |
콘월어 |
| co |
코르시카어 |
| crh |
크림 타타르어(라틴어) |
| hr |
크로아티아어 |
| cs |
체코어 |
| da |
덴마크어 |
| prs |
Dari |
| dhi |
Dhimal(데바나기리어) |
| doi |
Dogri(데바나기리어) |
| nl |
네덜란드어 |
| en |
English |
| myv |
에르자어(키릴 자모) |
| et |
Estonian |
| fo |
페로어 |
| fj |
피지어 |
| fil |
필리핀어 |
| fi |
핀란드어 |
| fr |
French |
| fur |
프룰리안 |
| gag |
가가우즈어(라틴어) |
| gl |
갈리시아어 |
| de |
German |
| gil |
길버트어 |
| gon |
Gondi(데바나기리어) |
| el |
그리스어 |
| kl |
그린란드어 |
| gvr |
Gurung(데바나기리어) |
| ht |
아이티어 |
| hlb |
Halbi(데바나기리어) |
| hni |
하니어 |
| bgc |
Haryanvi |
| haw |
하와이어 |
| hi |
힌디어 |
| mww |
몽 다오어(라틴어) |
| hoc |
호(데바나기리) |
| hu |
Hungarian |
| is |
아이슬란드어 |
| smn |
이나리 사미어 |
| id |
Indonesian |
| ia |
국제어 |
| iu |
이누크티투트어 (라틴어) |
| ga |
아일랜드어 |
| it |
Italian |
| ja |
Japanese |
| Jns |
Jaunsari(데바나기리어) |
| jv |
자바어 |
| kea |
카보베르디아누 |
| kac |
카친어(라틴어) |
| xnr |
Kangri(데바나기리어) |
| krc |
카라차이발카르어 |
| kaa-cyrl |
카라칼파크어(키릴 자모) |
| kaa |
카라칼파크어(라틴어) |
| csb |
카슈비아어 |
| kk-cyrl |
카자흐어(키릴 자모) |
| kk-latn |
카자흐어(라틴어) |
| klr |
칼링 |
| kha |
카시어 |
| quc |
키체어 |
| ko |
한국어 |
| kfq |
Korku |
| kpy |
코랴크어 |
| kos |
코스라에어 |
| kum |
쿠믹어(키릴 자모) |
| ku-arab |
쿠르드어(아랍어) |
| ku-latn |
쿠르드어(라틴 문자) |
| kru |
쿠루흐어(데바나기리어) |
| ky |
키르기스어(키릴 자모) |
| lkt |
라코타어 |
| la |
라틴어 |
| lt |
리투아니아어 |
| dsb |
저지 소르브어 |
| smj |
룰레 사미어 |
| lb |
룩셈부르크어 |
| bfz |
Mahasu Pahari(데바나기리어) |
| ms |
말레이어(라틴 문자) |
| mt |
몰타어 |
| kmj |
Malto(데바나기리어) |
| gv |
맹크스어 |
| mi |
마오리어 |
| mr |
마라티어 |
| mn |
몽골어(키릴 자모) |
| cnr-cyrl |
몬테네그린어(키릴 자모) |
| cnr-latn |
몬테네그린어(라틴어) |
| nap |
나폴리어 |
| ne |
네팔어 |
| niu |
니우에안어 |
| nog |
노가이어 |
| sme |
북부 사미어(라틴어) |
| nb |
노르웨이어 |
| no |
노르웨이어 |
| oc |
오크어 |
| os |
오세트어 |
| ps |
파슈토어 |
| fa |
Persian |
| pl |
Polish |
| pt |
포르투갈어 |
| pa |
펀잡어(아랍어) |
| ksh |
리프아리안어 |
| ro |
루마니아어 |
| rm |
로망슈어 |
| ru |
Russian |
| sck |
Sadri(데바나기리어) |
| sm |
사모아어(라틴어) |
| sa |
산스크리트어(데바나기리) |
| sat |
산탈리(데바나기리) |
| sco |
스코틀랜드어 |
| gd |
스코틀랜드 게일어 |
| sr |
세르비아어(라틴 문자) |
| sr-Cyrl |
세르비아어(키릴 문자) |
| sr-Latn |
세르비아어(라틴 문자) |
| xsr |
Sherpa(데바나기리어) |
| srx |
Sirmauri(데바나기리어) |
| sms |
스콜트 사미어 |
| sk |
슬로바키아어 |
| sl |
슬로베니아어 |
| so |
소말리어(아랍어) |
| sma |
남부 사미어 |
| es |
Spanish |
| sw |
스와힐리어(라틴어) |
| sv |
스웨덴어 |
| tg |
타지크어(키릴 자모) |
| tt |
타타르어 (라틴어) |
| tet |
테툼어 |
| thf |
탕미 |
| to |
통가어 |
| tr |
터키어 |
| tk |
투르크멘어(라틴어) |
| tyv |
투반어 |
| hsb |
북부 슬라브어 |
| ur |
우르두어 |
| ug |
위구르어(아랍어) |
| uz-arab |
우즈베키스탄어(아랍어) |
| uz-cyrl |
우즈베크어(키릴 자모) |
| uz |
우즈베크어(라틴 문자) |
| vo |
볼라퓌크어 |
| wae |
Walser |
| cy |
웨일스어 |
| fy |
서 프리지아어 |
| yua |
유카텍 마야어 |
| za |
장족어 |
| zu |
줄루어 |
| unk |
알 수 없음(모두) |
OutputFieldMappingEntry
스킬에 대한 출력 필드 매핑입니다.
| Name | 형식 | Description |
|---|---|---|
| name |
string |
스킬에 의해 정의된 출력의 이름입니다. |
| targetName |
string |
출력의 대상 이름입니다. 선택 사항이며 기본값은 name입니다. |
PIIDetectionSkill
Text Analytics API를 사용하여 입력 텍스트에서 개인 정보를 추출하고 마스킹 옵션을 제공합니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| domain |
string |
지정된 경우 엔터티 범주의 하위 집합만 포함하도록 PII 도메인을 설정합니다. 가능한 값은 'phi', 'none'입니다. 기본값은 '없음'입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| maskingCharacter |
string maxLength: 1 |
maskingMode 매개 변수가 replace로 설정된 경우 텍스트를 마스킹하는 데 사용되는 문자입니다. 기본값은 '*'입니다. |
| maskingMode |
입력 텍스트에서 감지된 개인정보를 마스킹할 수 있는 다양한 방법을 제공하는 파라미터입니다. 기본값은 '없음'입니다. |
|
| minimumPrecision |
number (double) minimum: 0maximum: 1 |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정되지 않으면(기본값) 명시적으로 null로 설정된 경우 모든 엔터티가 포함됩니다. |
| modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않은 경우 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 꼭 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
|
| piiCategories |
string[] |
추출하고 마스킹해야 하는 PII 엔터티 범주 목록입니다. |
PIIDetectionSkillMaskingMode
입력 텍스트에서 검색된 개인 정보를 마스킹하는 데 사용할 maskingMode를 나타내는 문자열입니다.
| 값 | Description |
|---|---|
| none |
마스킹이 발생하지 않으며 maskedText 출력이 반환되지 않습니다. |
| replace |
감지된 엔터티를 maskingCharacter 매개변수에 지정된 문자로 바꿉니다. 오프셋이 입력 텍스트와 출력 maskedText 모두에 올바르게 해당하도록 문자는 감지된 엔터티의 길이까지 반복됩니다. |
SearchIndexerDataNoneIdentity
데이터 원본의 ID 속성을 지웁니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
ID 유형을 지정하는 URI 조각입니다. |
SearchIndexerDataUserAssignedIdentity
사용할 데이터 원본의 ID를 지정합니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
ID 유형을 지정하는 URI 조각입니다. |
| userAssignedIdentity |
string |
검색 서비스에 할당되어야 하는 "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" 형식의 사용자 할당 관리 ID의 정규화된 Azure 리소스 ID입니다. |
SearchIndexerIndexProjections
보조 검색 인덱스에 대한 추가 프로젝션의 정의입니다.
| Name | 형식 | Description |
|---|---|---|
| parameters |
인덱스 프로젝션별 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다. |
|
| selectors |
보조 검색 인덱스에 대해 수행할 프로젝션 목록입니다. |
SearchIndexerIndexProjectionSelector
지정된 검색 인덱스에 저장할 데이터에 대한 설명입니다.
| Name | 형식 | Description |
|---|---|---|
| mappings |
프로젝션에 대한 매핑 또는 대상 인덱스의 필드에 매핑해야 하는 원본입니다. |
|
| parentKeyFieldName |
string |
상위 문서의 키 값을 매핑할 검색 인덱스의 필드 이름입니다. 키 필드가 아닌 필터링 가능한 문자열 필드여야 합니다. |
| sourceContext |
string |
프로젝션의 원본 컨텍스트입니다. 문서가 여러 하위 문서로 분할되는 카디널리티를 나타냅니다. |
| targetIndexName |
string |
프로젝션할 검색 인덱스의 이름입니다. '키워드' 분석기가 설정된 키 필드가 있어야 합니다. |
SearchIndexerIndexProjectionsParameters
인덱스 프로젝션별 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다.
| Name | 형식 | Description |
|---|---|---|
| projectionMode |
인덱서의 나머지 부분과 관련된 인덱스 프로젝션의 동작을 정의합니다. |
SearchIndexerKnowledgeStore
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션을 정의합니다.
| Name | 형식 | Description |
|---|---|---|
| projections |
인덱싱 중에 수행할 추가 프로젝션 목록입니다. |
|
| storageConnectionString |
string |
스토리지 계정 프로젝션에 대한 연결 문자열이 저장됩니다. |
SearchIndexerKnowledgeStoreFileProjectionSelector
Azure Files에 저장할 데이터에 대한 프로젝션 정의입니다.
| Name | 형식 | Description |
|---|---|---|
| generatedKeyName |
string |
프로젝션을 저장할 생성된 키의 이름입니다. |
| inputs |
복잡한 투영을 위한 중첩된 입력. |
|
| referenceKeyName |
string |
다른 투영에 대한 참조 키의 이름입니다. |
| source |
string |
프로젝트에 대한 소스 데이터. |
| sourceContext |
string |
복잡한 프로젝션에 대한 소스 컨텍스트입니다. |
| storageContainer |
string |
프로젝션을 저장할 Blob 컨테이너입니다. |
SearchIndexerKnowledgeStoreObjectProjectionSelector
Azure Blob에 저장할 데이터에 대한 프로젝션 정의입니다.
| Name | 형식 | Description |
|---|---|---|
| generatedKeyName |
string |
프로젝션을 저장할 생성된 키의 이름입니다. |
| inputs |
복잡한 투영을 위한 중첩된 입력. |
|
| referenceKeyName |
string |
다른 투영에 대한 참조 키의 이름입니다. |
| source |
string |
프로젝트에 대한 소스 데이터. |
| sourceContext |
string |
복잡한 프로젝션에 대한 소스 컨텍스트입니다. |
| storageContainer |
string |
프로젝션을 저장할 Blob 컨테이너입니다. |
SearchIndexerKnowledgeStoreProjection
다양한 프로젝션 선택기에 대한 컨테이너 개체입니다.
| Name | 형식 | Description |
|---|---|---|
| files |
Azure 파일 스토리지에 대한 프로젝션. |
|
| objects |
Azure Blob Storage에 대한 프로젝션. |
|
| tables |
Azure Table Storage에 대한 프로젝션입니다. |
SearchIndexerKnowledgeStoreTableProjectionSelector
Azure Tables에 저장할 데이터에 대한 설명입니다.
| Name | 형식 | Description |
|---|---|---|
| generatedKeyName |
string |
프로젝션을 저장할 생성된 키의 이름입니다. |
| inputs |
복잡한 투영을 위한 중첩된 입력. |
|
| referenceKeyName |
string |
다른 투영에 대한 참조 키의 이름입니다. |
| source |
string |
프로젝트에 대한 소스 데이터. |
| sourceContext |
string |
복잡한 프로젝션에 대한 소스 컨텍스트입니다. |
| tableName |
string |
프로젝션된 데이터를 저장할 Azure 테이블의 이름입니다. |
SearchIndexerSkillset
기술 목록입니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.etag |
string |
기술 세트의 ETag입니다. |
| cognitiveServices | CognitiveServicesAccount: |
기술을 실행할 때 사용할 Azure AI 서비스에 대한 세부 정보입니다. |
| description |
string |
기술 세트에 대한 설명입니다. |
| encryptionKey |
Azure Key Vault에서 만드는 암호화 키에 대한 설명입니다. 이 키는 Microsoft를 포함한 누구도 기술 세트 정의의 암호를 해독할 수 없다는 완전한 확신을 원하는 경우 기술 집합 정의에 대한 추가 수준의 미사용 암호화를 제공하는 데 사용됩니다. 기술 세트 정의를 암호화하면 항상 암호화된 상태로 유지됩니다. 검색 서비스는 이 속성을 null로 설정하려는 시도를 무시합니다. 암호화 키를 순환하려는 경우 필요에 따라 이 속성을 변경할 수 있습니다. 기술 세트 정의는 영향을 받지 않습니다. 고객 관리형 키를 사용한 암호화는 무료 검색 서비스에서 사용할 수 없으며 2019년 1월 1일 이후에 생성된 유료 서비스에서만 사용할 수 있습니다. |
|
| indexProjections |
2차 검색 인덱스에 대한 추가 프로젝션의 정의. |
|
| knowledgeStore |
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션을 정의합니다. |
|
| name |
string |
기술 세트의 이름입니다. |
| skills |
SearchIndexerSkill[]:
|
기술 세트의 기술 목록입니다. |
SearchResourceEncryptionKey
Azure Key Vault의 고객 관리형 암호화 키입니다. 만들고 관리하는 키를 사용하여 인덱스 및 동의어 맵과 같은 미사용 데이터를 암호화하거나 복호화할 수 있습니다.
| Name | 형식 | Description |
|---|---|---|
| accessCredentials |
Azure Key Vault에 액세스하는 데 사용되는 선택적 Azure Active Directory 자격 증명입니다. 대신 관리 ID를 사용하는 경우에는 필요하지 않습니다. |
|
| keyVaultKeyName |
string |
미사용 데이터를 암호화하는 데 사용할 Azure Key Vault 키의 이름입니다. |
| keyVaultKeyVersion |
string |
미사용 데이터를 암호화하는 데 사용할 Azure Key Vault 키의 버전입니다. |
| keyVaultUri |
string |
미사용 데이터를 암호화하는 데 사용할 키를 포함하는 Azure Key Vault의 URI(DNS 이름이라고도 함)입니다. URI |
SentimentSkill
이 기술은 더 이상 사용되지 않습니다. V3를 사용하십시오. SentimentSkill을 사용합니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
SentimentSkillLanguage
Deprecated. SentimentSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다.
| 값 | Description |
|---|---|
| da |
덴마크어 |
| nl |
네덜란드어 |
| en |
English |
| fi |
핀란드어 |
| fr |
French |
| de |
German |
| el |
그리스어 |
| it |
Italian |
| no |
노르웨이어(복말) |
| pl |
Polish |
| pt-PT |
포르투갈어(포르투갈) |
| ru |
Russian |
| es |
Spanish |
| sv |
스웨덴어 |
| tr |
터키어 |
SentimentSkillV3
Text Analytics API를 사용하여 구조화되지 않은 텍스트를 평가하고 각 레코드에 대해 문장 및 문서 수준에서 서비스에서 찾은 가장 높은 신뢰도 점수를 기반으로 감정 레이블(예: "부정적", "중립적" 및 "긍정적")을 제공합니다.
| Name | 형식 | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
|
| defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
|
| includeOpinionMining |
boolean |
False |
true로 설정하면 기술 출력에는 오피니언 마이닝을 위한 Text Analytics의 정보, 즉 텍스트의 대상(명사 또는 동사) 및 관련 평가(형용사)가 포함됩니다. 기본값은 false입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
||
| modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않은 경우 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 꼭 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
|
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
ShaperSkill
출력을 재구성하는 기술입니다. 복합 필드(다중 파트 필드라고도 함)를 지원하는 복합 형식을 만듭니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
SplitSkill
문자열을 텍스트 덩어리로 분할하는 기술입니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| maximumPageLength |
integer (int32) |
원하는 최대 페이지 길이입니다. 기본값은 10000입니다. |
| maximumPagesToTake |
integer (int32) |
textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정된 경우 SplitSkill은 각 문서에서 몇 개의 초기 페이지만 필요할 때 성능을 향상시키기 위해 첫 번째 'maximumPagesToTake' 페이지를 처리한 후 분할을 중단합니다. |
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
|
| pageOverlapLength |
integer (int32) |
textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정된 경우 n+1번째 청크는 n번째 청크 끝에서 이 수의 문자/토큰으로 시작합니다. |
| textSplitMode |
수행할 분할 모드를 나타내는 값입니다. |
SplitSkillLanguage
SplitSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다.
| 값 | Description |
|---|---|
| am |
암하라어 |
| bs |
Bosnian |
| cs |
체코어 |
| da |
덴마크어 |
| de |
German |
| en |
English |
| es |
Spanish |
| et |
Estonian |
| fi |
핀란드어 |
| fr |
French |
| he |
히브리어 |
| hi |
힌디어 |
| hr |
크로아티아어 |
| hu |
Hungarian |
| id |
Indonesian |
| is |
아이슬란드어 |
| it |
Italian |
| ja |
Japanese |
| ko |
한국어 |
| lv |
Latvian |
| nb |
노르웨이어 |
| nl |
네덜란드어 |
| pl |
Polish |
| pt |
포르투갈어(포르투갈) |
| pt-br |
포르투갈어 (브라질) |
| ru |
Russian |
| sk |
슬로바키아어 |
| sl |
슬로베니아어 |
| sr |
세르비아어 |
| sv |
스웨덴어 |
| tr |
터키어 |
| ur |
우르두어 |
| zh |
중국어 (간체) |
TextSplitMode
수행할 분할 모드를 나타내는 값입니다.
| 값 | Description |
|---|---|
| pages |
텍스트를 개별 페이지로 분할합니다. |
| sentences |
텍스트를 개별 문장으로 분할합니다. |
TextTranslationSkill
텍스트를 한 언어에서 다른 언어로 번역하는 기술입니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| defaultFromLanguageCode |
보낸 사람 언어를 명시적으로 지정하지 않은 문서에 대해 문서를 번역할 언어 코드입니다. |
|
| defaultToLanguageCode |
to 언어를 명시적으로 지정하지 않은 문서에 대해 문서를 번역할 언어 코드입니다. |
|
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
|
| suggestedFrom |
fromLanguageCode 입력이나 defaultFromLanguageCode 매개변수가 모두 제공되지 않고 자동 언어 감지에 실패할 때 문서를 번역할 언어 코드입니다. 기본값은 |
TextTranslationSkillLanguage
TextTranslationSkill에서 입력 텍스트에 대해 지원하는 언어 코드입니다.
| 값 | Description |
|---|---|
| af |
아프리칸스어 |
| ar |
Arabic |
| bn |
벵골어 |
| bs |
보스니아어(라틴 문자) |
| bg |
불가리아어 |
| yue |
광둥어(번체) |
| ca |
카탈로니아어 |
| zh-Hans |
중국어 간체 |
| zh-Hant |
중국어 번체 |
| hr |
크로아티아어 |
| cs |
체코어 |
| da |
덴마크어 |
| nl |
네덜란드어 |
| en |
English |
| et |
Estonian |
| fj |
피지어 |
| fil |
필리핀어 |
| fi |
핀란드어 |
| fr |
French |
| de |
German |
| el |
그리스어 |
| ht |
아이티어 |
| he |
히브리어 |
| hi |
힌디어 |
| mww |
몽다우어 |
| hu |
Hungarian |
| is |
아이슬란드어 |
| id |
Indonesian |
| it |
Italian |
| ja |
Japanese |
| sw |
Kiswahili |
| tlh |
클링온 |
| tlh-Latn |
클링온어(라틴 스크립트) |
| tlh-Piqd |
클링온어(클링온 문자) |
| ko |
한국어 |
| lv |
Latvian |
| lt |
리투아니아어 |
| mg |
말라가시어 |
| ms |
말레이어 |
| mt |
몰타어 |
| nb |
노르웨이어 |
| fa |
Persian |
| pl |
Polish |
| pt |
포르투갈어 |
| pt-br |
포르투갈어 (브라질) |
| pt-PT |
포르투갈어(포르투갈) |
| otq |
케레타로 오토미어 |
| ro |
루마니아어 |
| ru |
Russian |
| sm |
사모아어 |
| sr-Cyrl |
세르비아어(키릴 문자) |
| sr-Latn |
세르비아어(라틴 문자) |
| sk |
슬로바키아어 |
| sl |
슬로베니아어 |
| es |
Spanish |
| sv |
스웨덴어 |
| ty |
타히티어 |
| ta |
타밀어 |
| te |
텔루구어 |
| th |
태국어 |
| to |
통가어 |
| tr |
터키어 |
| uk |
우크라이나어 |
| ur |
우르두어 |
| vi |
베트남어 |
| cy |
웨일스어 |
| yua |
유카텍 마야어 |
| ga |
아일랜드어 |
| kn |
Kannada |
| mi |
마오리어 |
| ml |
말라얄람어 |
| pa |
펀잡어 |
VisualFeature
반환할 시각적 기능 유형을 나타내는 문자열입니다.
| 값 | Description |
|---|---|
| adult |
성인으로 인식되는 시각적 특징. |
| brands |
상업 브랜드로 인정받는 시각적 특징. |
| categories |
카테고리. |
| description |
Description. |
| faces |
사람의 얼굴로 인식되는 시각적 특징. |
| objects |
객체로 인식되는 시각적 특징. |
| tags |
태그. |
WebApiSkill
Web API 엔드포인트를 호출할 수 있는 기술로, 사용자 지정 코드를 호출하여 기술 세트를 확장할 수 있습니다.
| Name | 형식 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
| authIdentity | SearchIndexerDataIdentity: |
아웃바운드 연결에 사용되는 사용자 할당 관리 ID입니다. authResourceId가 제공되고 지정되지 않은 경우 시스템 할당 관리 ID가 사용됩니다. 인덱서를 업데이트할 때 ID가 지정되지 않은 경우 값은 변경되지 않은 상태로 유지됩니다. "none"으로 설정하면 이 속성의 값이 지워집니다. |
| authResourceId |
string |
Azure 함수 또는 변환을 제공하는 다른 응용 프로그램의 외부 코드에 연결하는 사용자 지정 기술에 적용됩니다. 이 값은 Azure Active Directory에 등록될 때 함수 또는 앱에 대해 만든 애플리케이션 ID여야 합니다. 지정된 경우 사용자 지정 기술은 검색 서비스의 관리 ID(시스템 또는 사용자 할당)와 함수 또는 앱의 액세스 토큰을 사용하여 함수 또는 앱에 연결되며, 이 값을 액세스 토큰의 범위를 만들기 위한 리소스 ID로 사용합니다. |
| batchSize |
integer (int32) |
문서 수를 나타내는 원하는 배치 크기입니다. |
| context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같이 작업이 발생하는 수준을 나타냅니다. 기본값은 /document입니다. |
| degreeOfParallelism |
integer (int32) |
설정된 경우 Web API에 대해 수행할 수 있는 병렬 호출 수입니다. |
| description |
string |
스킬의 입력, 출력 및 사용을 설명하는 스킬에 대한 설명입니다. |
| httpHeaders |
object |
http 요청을 수행하는 데 필요한 헤더입니다. |
| httpMethod |
string |
http 요청의 메서드입니다. |
| inputs |
스킬의 입력은 소스 데이터 세트의 열이거나 업스트림 스킬의 출력일 수 있습니다. |
|
| name |
string |
기술 집합 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 스킬에는 스킬 배열에서 1부터 시작하는 인덱스의 기본 이름이 주어지며, 접두사는 '#'입니다. |
| outputs |
스킬의 출력은 검색 인덱스의 필드 또는 다른 스킬에서 입력으로 사용할 수 있는 값입니다. |
|
| timeout |
string (duration) |
요청에 대해 원하는 시간 제한입니다. 기본값은 30초입니다. |
| uri |
string |
Web API의 URL입니다. |