Skillsets - Create
在搜尋服務中建立新的技能集。
POST {endpoint}/skillsets?api-version=2025-09-01
URI 參數
| 名稱 | 位於 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
搜尋服務的端點 URL。 |
|
api-version
|
query | True |
string |
用戶端 API 版本。 |
要求標頭
| 名稱 | 必要 | 類型 | Description |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
隨請求一起傳送的追蹤 ID,以協助偵錯。 |
要求本文
| 名稱 | 必要 | 類型 | Description |
|---|---|---|---|
| name | True |
string |
技能集的名稱。 |
| skills | True |
SearchIndexerSkill[]:
|
技能集中的技能清單。 |
| @odata.etag |
string |
技能組的 ETag。 |
|
| cognitiveServices | CognitiveServicesAccount: |
執行技能時要使用的 Azure AI 服務的詳細數據。 |
|
| description |
string |
技能組的描述。 |
|
| encryptionKey |
您在 Azure 金鑰保存庫中建立的加密金鑰描述。 當您想要完全保證沒有人 (甚至 Microsoft) 無法解密您的技能集定義時,此金鑰可用來為您的技能組定義提供額外的待用加密層級。 加密技能組定義之後,它一律會保持加密狀態。 搜尋服務會忽略嘗試將此屬性設定為 Null。 如果您想要輪替加密金鑰,您可以視需要變更此屬性;您的技能組合定義將不受影響。 使用客戶管理的金鑰進行加密不適用於免費搜尋服務,且僅適用於 2019 年 1 月 1 日或之後建立的付費服務。 |
||
| indexProjections |
對二級搜索索引的額外預測的定義。 |
||
| knowledgeStore |
定義擴充資料的 Azure Blob、資料表或檔案的其他投影。 |
回應
| 名稱 | 類型 | Description |
|---|---|---|
| 201 Created |
技能組合已成功建立。 |
|
| Other Status Codes |
錯誤回應。 |
範例
SearchServiceCreateSkillset
範例要求
POST https://stableexampleservice.search.windows.net/skillsets?api-version=2025-09-01
{
"name": "tempskillset",
"description": "Skillset for extracting entities and more",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "skill2",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"textSplitMode": "pages",
"maximumPageLength": 4000,
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "skill3",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "skill4",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"uri": "https://contoso.example.org/",
"httpMethod": "POST",
"timeout": "PT5S",
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "skill5",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
]
},
{
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill",
"context": "/document",
"inputs": [
{
"name": "file_data",
"source": "/document/content"
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
},
{
"outputFormat": "text",
"outputMode": "oneToMany",
"extractionOptions": [
"images",
"locationMetadata"
],
"chunkingProperties": {
"unit": "characters",
"maximumLength": 500,
"overlapLength": 50
},
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill#2",
"context": "/document",
"inputs": [
{
"name": "file_data",
"source": "/document/content"
}
],
"outputs": [
{
"name": "text_sections",
"targetName": "text_sections"
},
{
"name": "normalized_images",
"targetName": "normalized_images"
}
]
}
],
"cognitiveServices": {
"@odata.type": "#Microsoft.Azure.Search.DefaultCognitiveServices",
"description": "Description of the Azure AI service resource attached to a skillset"
},
"@odata.etag": "0x1234568AE7E58A1"
}
範例回覆
{
"@odata.etag": "0x1234568AE7E58A1",
"name": "tempskillset",
"description": "Skillset for extracting entities and more",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "skill2",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "countryHint",
"source": "/document/countryHint",
"inputs": []
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "skill3",
"textSplitMode": "pages",
"maximumPageLength": 4000,
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "skill4",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "skill5",
"uri": "https://contoso.example.org/",
"httpMethod": "POST",
"timeout": "PT5S",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"extractionOptions": [],
"inputs": [
{
"name": "file_data",
"source": "/document/content",
"inputs": []
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill#2",
"context": "/document",
"outputMode": "oneToMany",
"outputFormat": "text",
"extractionOptions": [
"images",
"locationMetadata"
],
"inputs": [
{
"name": "file_data",
"source": "/document/content",
"inputs": []
}
],
"outputs": [
{
"name": "text_sections",
"targetName": "text_sections"
},
{
"name": "normalized_images",
"targetName": "normalized_images"
}
],
"chunkingProperties": {
"unit": "characters",
"maximumLength": 500,
"overlapLength": 50
}
}
],
"cognitiveServices": {
"@odata.type": "#Microsoft.Azure.Search.DefaultCognitiveServices",
"description": "Description of the Azure AI service resource attached to a skillset"
}
}
定義
| 名稱 | Description |
|---|---|
|
Azure |
針對搜尋服務建立之已註冊應用程式認證,用於對儲存在 Azure 金鑰保存庫中的加密金鑰進行驗證存取。 |
|
Azure |
可讓您使用 Azure OpenAI 資源為指定的文字輸入產生向量內嵌。 |
|
Azure |
將呼叫的 Azure Open AI 模型名稱。 |
|
Cognitive |
附加至技能組之 Azure AI 服務資源的多區域帳戶金鑰。 |
|
Conditional |
一種技能,可讓需要布林運算的案例來決定要指派給輸出的資料。 |
|
Custom |
包含找到之相符項目的相關資訊,以及相關中繼資料的物件。 |
|
Custom |
可用來指定根實體名稱的替代拼字或同義字的複雜物件。 |
|
Custom |
技能會從自訂的使用者定義的單字和片語清單中尋找文字。 |
|
Custom |
CustomEntityLookupSkill 支援輸入文字的語言代碼。 |
|
Default |
空白物件,代表技能組的預設 Azure AI 服務資源。 |
|
Document |
從擴充管線內的檔案擷取內容的技能。 |
|
Document |
透過 Azure AI 服務從擴充管線內的檔案擷取內容和版面配置資訊的技能。 |
|
Document |
控制區塊化內容的基數。 |
|
Document |
控制 chunk unit 的基數。 預設值為「字元」 |
|
Document |
控制技能從文件擷取的內容基數。 |
|
Document |
Markdown 輸出中標頭的深度。 預設值為 h6。 |
|
Document |
控制輸出格式的基數。 預設值為「降價」。 |
|
Document |
控制技能所產生的輸出基數。 預設值為 'oneToMany'。 |
|
Entity |
指出要傳回哪些實體類別的字串。 |
|
Entity |
使用文字分析 API,從文字擷取連結的實體。 |
|
Entity |
此技能已被取代。 使用 V3。EntityRecognitionSkill 的技能。 |
|
Entity |
Deprecated. EntityRecognitionSkill 支援輸入文字的語言代碼。 |
|
Entity |
使用文字分析 API,從文字擷取不同類型的實體。 |
|
Error |
資源管理錯誤其他資訊。 |
|
Error |
錯誤詳細數據。 |
|
Error |
錯誤回應 |
|
Image |
分析影像檔案的技能。 它根據圖像內容提取一組豐富的視覺特徵。 |
|
Image |
ImageAnalysisSkill 支援輸入的語言代碼。 |
|
Image |
指出要傳回哪些網域特定詳細資料的字串。 |
|
Index |
定義索引投影相對於索引子其餘部分的行為。 |
|
Input |
技能的輸入欄位對應。 |
|
Key |
使用文字分析進行關鍵片語擷取的技能。 |
|
Key |
KeyPhraseExtractionSkill 支援輸入文字的語言代碼。 |
|
Language |
一種技能,可偵測輸入文字的語言,並為請求提交的每個文件報告單一語言代碼。 語言代碼與指示分析信賴度的分數配對。 |
|
Line |
定義要在 OCR 技能識別的文字行之間使用的字元順序。 預設值為「space」。 |
|
Merge |
將兩個或多個字串合併為單一統一字串的技能,並使用可選的使用者定義分隔符號來分隔每個元件部分。 |
|
Ocr |
從圖像文件中提取文本的技能。 |
|
Ocr |
OcrSkill 支援輸入的語言代碼。 |
|
Output |
技能的輸出欄位對應。 |
|
PIIDetection |
使用文字分析 API,從輸入文字擷取個人資訊,並為您提供遮罩它的選項。 |
|
PIIDetection |
一個字串,指出要使用的 maskingMode 來遮罩輸入文字中偵測到的個人資訊。 |
|
Search |
清除資料來源的身分識別屬性。 |
|
Search |
指定要使用的資料來源身分識別。 |
|
Search |
定義二級搜尋索引的其他投影。 |
|
Search |
要儲存在指定搜尋索引中的資料的說明。 |
|
Search |
索引投影特定組態屬性的字典。 每個名稱都是特定屬性的名稱。 每個值都必須是基本類型。 |
|
Search |
定義擴充資料的 Azure Blob、資料表或檔案的其他投影。 |
|
Search |
要儲存在 Azure 檔案儲存體中的資料的投影定義。 |
|
Search |
要儲存在 Azure Blob 中的資料的投影定義。 |
|
Search |
各種投影選取器的容器物件。 |
|
Search |
要儲存在 Azure 資料表中的資料描述。 |
|
Search |
技能清單。 |
|
Search |
Azure Key Vault 中的客戶管理加密金鑰。 您建立和管理的金鑰可用來加密或解密靜態資料,例如索引和同義字對映。 |
|
Sentiment |
此技能已被取代。 使用 V3。SentimentSkill 的 |
|
Sentiment |
Deprecated. SentimentSkill 支援輸入文字的語言代碼。 |
|
Sentiment |
使用文字分析 API,評估非結構化文字,並針對每筆記錄,根據服務在句子和文件層級找到的最高信賴分數,提供情緒標籤 (例如「負面」、「中性」和「正面」)。 |
|
Shaper |
重塑輸出的技能。 它會建立複雜類型來支援複合欄位 (也稱為多部分欄位)。 |
|
Split |
將字串分割成文字區塊的技能。 |
|
Split |
SplitSkill 支援輸入文字的語言代碼。 |
|
Text |
指出要執行的分割模式的值。 |
|
Text |
將文本從一種語言翻譯成另一種語言的技能。 |
|
Text |
TextTranslationSkill 支援輸入文字的語言代碼。 |
|
Visual |
指出要傳回哪些視覺功能類型的字串。 |
|
Web |
可呼叫 Web API 端點的技能,可讓您藉由呼叫自訂程式碼來擴充技能集。 |
AzureActiveDirectoryApplicationCredentials
針對搜尋服務建立之已註冊應用程式認證,用於對儲存在 Azure 金鑰保存庫中的加密金鑰進行驗證存取。
| 名稱 | 類型 | Description |
|---|---|---|
| applicationId |
string |
已授與 Azure 金鑰保存庫所需存取權限的 AAD 應用程式識別碼,可在加密待用資料時使用。 應用程式識別碼不應與 AAD 應用程式的物件識別碼混淆。 |
| applicationSecret |
string |
指定 AAD 應用程式的驗證金鑰。 |
AzureOpenAIEmbeddingSkill
可讓您使用 Azure OpenAI 資源為指定的文字輸入產生向量內嵌。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| apiKey |
string |
指定 Azure OpenAI 資源的 API 金鑰。 |
| authIdentity | SearchIndexerDataIdentity: |
用於輸出連線的使用者指派受控識別。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| deploymentId |
string |
指定資源上 Azure OpenAI 模型部署的識別碼。 |
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| dimensions |
integer (int32) |
產生的輸出內嵌應具有的維度數目。 僅在 text-embedding-3 和更新版本中支援。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| modelName |
部署在提供的 deploymentId 路徑上的內嵌模型名稱。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
|
| resourceUri |
string (uri) |
Azure OpenAI 資源的資源 URI。 |
AzureOpenAIModelName
將呼叫的 Azure Open AI 模型名稱。
| 值 | Description |
|---|---|
| text-embedding-ada-002 | |
| text-embedding-3-large | |
| text-embedding-3-small |
CognitiveServicesAccountKey
附加至技能組之 Azure AI 服務資源的多區域帳戶金鑰。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定附加至技能組的 Azure AI 服務資源類型的 URI 片段。 |
| description |
string |
附加至技能組的 Azure AI 服務資源描述。 |
| key |
string |
用來佈建附加至技能組的 Azure AI 服務資源的金鑰。 |
ConditionalSkill
一種技能,可讓需要布林運算的案例來決定要指派給輸出的資料。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
CustomEntity
包含找到之相符項目的相關資訊,以及相關中繼資料的物件。
| 名稱 | 類型 | Description |
|---|---|---|
| accentSensitive |
boolean |
預設為 False。 布林值,表示與實體名稱的比較是否應該對重音敏感。 |
| aliases |
複雜物件陣列,可用來指定根實體名稱的替代拼字或同義字。 |
|
| caseSensitive |
boolean |
預設為 False。 布林值,表示與實體名稱的比較是否應該對字元大小寫敏感。 「Microsoft」 的不區分大小寫的比對範例可能是:microsoft、microSoft、MICROSOFT。 |
| defaultAccentSensitive |
boolean |
變更此實體的預設重音敏感度值。 它用於更改所有別名的默認值 accentSensitive 值。 |
| defaultCaseSensitive |
boolean |
變更此實體的預設區分大小寫值。 它用來變更所有別名 caseSensitive 值的預設值。 |
| defaultFuzzyEditDistance |
integer (int32) |
變更此圖元的預設模糊編輯距離值。 它可用來變更所有別名 fuzzyEditDistance 值的預設值。 |
| description |
string |
此欄位可用作有關匹配文本的自定義中繼資料的傳遞。 此欄位的值將與技能輸出中其實體的每次匹配一起顯示。 |
| fuzzyEditDistance |
integer (int32) |
預設為 0。 最大值為 5。 表示仍會與實體名稱相符的可接受不同字元數目。 會傳回任何指定相符專案的最小可能模糊度。 例如,如果編輯距離設定為 3,則「Windows10」仍會符合「Windows」、「Windows10」和「Windows 7」。 當區分大小寫設定為 false 時,大小差異不會計入模糊容錯,但其他方面會計入。 |
| id |
string |
此欄位可用作有關匹配文本的自定義中繼資料的傳遞。 此欄位的值將與技能輸出中其實體的每次匹配一起顯示。 |
| name |
string |
最上層實體描述元。 技能輸出中的相符項目將依此名稱分組,並且它應該代表所找到的文字的「標準化」形式。 |
| subtype |
string |
此欄位可用作有關匹配文本的自定義中繼資料的傳遞。 此欄位的值將與技能輸出中其實體的每次匹配一起顯示。 |
| type |
string |
此欄位可用作有關匹配文本的自定義中繼資料的傳遞。 此欄位的值將與技能輸出中其實體的每次匹配一起顯示。 |
CustomEntityAlias
可用來指定根實體名稱的替代拼字或同義字的複雜物件。
| 名稱 | 類型 | Description |
|---|---|---|
| accentSensitive |
boolean |
判斷別名是否敏感於重音。 |
| caseSensitive |
boolean |
判斷別名是否區分大小寫。 |
| fuzzyEditDistance |
integer (int32) |
決定別名的模糊編輯距離。 |
| text |
string |
別名的文字。 |
CustomEntityLookupSkill
技能會從自訂的使用者定義的單字和片語清單中尋找文字。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultLanguageCode |
指出要使用的語言程式碼的值。 預設值為 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| entitiesDefinitionUri |
string |
JSON 或 CSV 檔案的路徑,其中包含要比對的所有目標文字。 此實體定義會在索引子執行開始時讀取。 在索引子執行期間,此檔案的任何更新都不會在後續執行之前生效。 此設定必須可透過HTTPS存取。 |
| globalDefaultAccentSensitive |
boolean |
AccentSensitive 的全球旗幟。 如果未在 CustomEntity 中設定 AccentSensitive,則此值會是預設值。 |
| globalDefaultCaseSensitive |
boolean |
CaseSensitive 的全域旗標。 如果未在 CustomEntity 中設定 CaseSensity,則此值會是預設值。 |
| globalDefaultFuzzyEditDistance |
integer (int32) |
FuzzyEditDistance 的全域旗標。 如果未在 CustomEntity 中設定 FuzzyEditDistance,則此值會是預設值。 |
| inlineEntitiesDefinition |
內嵌 CustomEntity 定義。 |
|
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
CustomEntityLookupSkillLanguage
CustomEntityLookupSkill 支援輸入文字的語言代碼。
| 值 | Description |
|---|---|
| da |
Danish |
| de |
德語 |
| en |
English |
| es |
西班牙文 |
| fi |
Finnish |
| fr |
法語 |
| it |
義大利語 |
| ko |
朝鮮語 |
| pt |
Portuguese |
DefaultCognitiveServicesAccount
空白物件,代表技能組的預設 Azure AI 服務資源。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定附加至技能組的 Azure AI 服務資源類型的 URI 片段。 |
| description |
string |
附加至技能組的 Azure AI 服務資源描述。 |
DocumentExtractionSkill
從擴充管線內的檔案擷取內容的技能。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| configuration |
object |
技能設定的字典。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| dataToExtract |
string |
要為技能擷取的資料類型。 如果未定義,將設定為 'contentAndMetadata'。 |
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
|
| parsingMode |
string |
技能的 parsingMode。 如果未定義,將設定為「預設」。 |
DocumentIntelligenceLayoutSkill
透過 Azure AI 服務從擴充管線內的檔案擷取內容和版面配置資訊的技能。
| 名稱 | 類型 | 預設值 | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
|
| chunkingProperties |
控制區塊化內容的基數。 |
||
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
|
| extractionOptions |
控制技能從文件擷取的內容基數 |
||
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
||
| markdownHeaderDepth | h6 |
Markdown 輸出中標頭的深度。 預設值為 h6。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
|
| outputFormat | markdown |
控制輸出格式的基數。 預設值為「降價」。 |
|
| outputMode | oneToMany |
控制技能所產生的輸出基數。 預設值為 'oneToMany'。 |
|
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
DocumentIntelligenceLayoutSkillChunkingProperties
控制區塊化內容的基數。
| 名稱 | 類型 | 預設值 | Description |
|---|---|---|---|
| maximumLength |
integer (int32) |
區塊長度上限(以字元為單位)。 預設值為 500。 |
|
| overlapLength |
integer (int32) |
在兩個文本塊之間提供的重疊長度。 預設值為 0。 |
|
| unit | characters |
區塊的單位。 |
DocumentIntelligenceLayoutSkillChunkingUnit
控制 chunk unit 的基數。 預設值為「字元」
| 值 | Description |
|---|---|
| characters |
依字元指定區塊。 |
DocumentIntelligenceLayoutSkillExtractionOptions
控制技能從文件擷取的內容基數。
| 值 | Description |
|---|---|
| images |
指定應從文件中擷取影像內容。 |
| locationMetadata |
指定應從文件中擷取位置中繼資料。 |
DocumentIntelligenceLayoutSkillMarkdownHeaderDepth
Markdown 輸出中標頭的深度。 預設值為 h6。
| 值 | Description |
|---|---|
| h1 |
標頭層級 1。 |
| h2 |
標頭層級 2。 |
| h3 |
標頭層級 3。 |
| h4 |
標頭層級 4。 |
| h5 |
標頭等級 5。 |
| h6 |
標頭層級 6。 |
DocumentIntelligenceLayoutSkillOutputFormat
控制輸出格式的基數。 預設值為「降價」。
| 值 | Description |
|---|---|
| text |
將輸出的格式指定為文字。 |
| markdown |
將輸出的格式指定為 markdown。 |
DocumentIntelligenceLayoutSkillOutputMode
控制技能所產生的輸出基數。 預設值為 'oneToMany'。
| 值 | Description |
|---|---|
| oneToMany |
指定輸出應該剖解析為 'oneToMany'。 |
EntityCategory
指出要傳回哪些實體類別的字串。
| 值 | Description |
|---|---|
| location |
描述實體位置的實體。 |
| organization |
描述組織的實體。 |
| person |
描述一個人的實體。 |
| quantity |
描述數量的實體。 |
| datetime |
描述日期和時間的實體。 |
| url |
描述 URL 的實體。 |
|
描述電子郵件地址的實體。 |
EntityLinkingSkill
使用文字分析 API,從文字擷取連結的實體。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultLanguageCode |
string |
指出要使用的語言程式碼的值。 預設值為 |
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| minimumPrecision |
number (double) minimum: 0maximum: 1 |
介於 0 和 1 之間的值,用於僅包含信賴度分數大於指定值的實體。 如果未設定 (預設值),或明確設定為 null,則會包含所有實體。 |
| modelVersion |
string |
呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。 |
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
EntityRecognitionSkill
此技能已被取代。 使用 V3。EntityRecognitionSkill 的技能。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| categories |
應擷取的實體類別清單。 |
|
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultLanguageCode |
指出要使用的語言程式碼的值。 預設值為 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| includeTypelessEntities |
boolean |
決定是否包含已知但不符合預先定義類型的實體。 如果未設定此組態 (預設值)、設定為 null 或設定為 false,則不會顯示不符合其中一個預先定義類型的實體。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| minimumPrecision |
number (double) |
介於 0 和 1 之間的值,用於僅包含信賴度分數大於指定值的實體。 如果未設定 (預設值),或明確設定為 null,則會包含所有實體。 |
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
EntityRecognitionSkillLanguage
Deprecated. EntityRecognitionSkill 支援輸入文字的語言代碼。
| 值 | Description |
|---|---|
| ar |
Arabic |
| cs |
Czech |
| zh-Hans |
簡體中文 |
| zh-Hant |
Chinese-Traditional |
| da |
Danish |
| nl |
Dutch |
| en |
English |
| fi |
Finnish |
| fr |
法語 |
| de |
德語 |
| el |
Greek |
| hu |
Hungarian |
| it |
義大利語 |
| ja |
日語 |
| ko |
朝鮮語 |
| no |
挪威語(博克馬爾) |
| pl |
波蘭語 |
| pt-PT |
葡萄牙文 (葡萄牙) |
| pt-BR |
葡萄牙文 (巴西) |
| ru |
Russian |
| es |
西班牙文 |
| sv |
Swedish |
| tr |
Turkish |
EntityRecognitionSkillV3
使用文字分析 API,從文字擷取不同類型的實體。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| categories |
string[] |
應擷取的實體類別清單。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultLanguageCode |
string |
指出要使用的語言程式碼的值。 預設值為 |
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| minimumPrecision |
number (double) minimum: 0maximum: 1 |
介於 0 和 1 之間的值,用於僅包含信賴度分數大於指定值的實體。 如果未設定 (預設值),或明確設定為 null,則會包含所有實體。 |
| modelVersion |
string |
呼叫文字分析 API 時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。 |
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
ErrorAdditionalInfo
資源管理錯誤其他資訊。
| 名稱 | 類型 | Description |
|---|---|---|
| info |
object |
其他資訊。 |
| type |
string |
其他信息類型。 |
ErrorDetail
錯誤詳細數據。
| 名稱 | 類型 | Description |
|---|---|---|
| additionalInfo |
錯誤其他資訊。 |
|
| code |
string |
錯誤碼。 |
| details |
錯誤詳細數據。 |
|
| message |
string |
錯誤訊息。 |
| target |
string |
錯誤目標。 |
ErrorResponse
錯誤回應
| 名稱 | 類型 | Description |
|---|---|---|
| error |
error 物件。 |
ImageAnalysisSkill
分析影像檔案的技能。 它根據圖像內容提取一組豐富的視覺特徵。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultLanguageCode |
指出要使用的語言程式碼的值。 預設值為 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| details |
指出要傳回哪些網域特定詳細資料的字串。 |
|
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
|
| visualFeatures |
視覺功能清單。 |
ImageAnalysisSkillLanguage
ImageAnalysisSkill 支援輸入的語言代碼。
| 值 | Description |
|---|---|
| ar |
Arabic |
| az |
亞塞拜然文 |
| bg |
Bulgarian |
| bs |
波士尼亞文 (拉丁) |
| ca |
加泰蘭文 |
| cs |
Czech |
| cy |
Welsh |
| da |
Danish |
| de |
德語 |
| el |
Greek |
| en |
English |
| es |
西班牙文 |
| et |
Estonian |
| eu |
巴斯克文 |
| fi |
Finnish |
| fr |
法語 |
| ga |
Irish |
| gl |
加利西亞文 |
| he |
希伯來文 |
| hi |
印地語 |
| hr |
Croatian |
| hu |
Hungarian |
| id |
Indonesian |
| it |
義大利語 |
| ja |
日語 |
| kk |
Kazakh |
| ko |
朝鮮語 |
| lt |
Lithuanian |
| lv |
Latvian |
| mk |
Macedonian |
| ms |
馬來文 (馬來西亞) |
| nb |
挪威文 (巴克摩) |
| nl |
Dutch |
| pl |
波蘭語 |
| prs |
Dari |
| pt-BR |
葡萄牙文 (巴西) |
| pt |
葡萄牙文 (葡萄牙) |
| pt-PT |
葡萄牙文 (葡萄牙) |
| ro |
Romanian |
| ru |
Russian |
| sk |
Slovak |
| sl |
Slovenian |
| sr-Cyrl |
塞爾維亞文 (斯拉夫 RS) |
| sr-Latn |
塞爾維亞文 (拉丁 RS) |
| sv |
Swedish |
| th |
Thai |
| tr |
Turkish |
| uk |
烏克蘭文 |
| vi |
Vietnamese |
| zh |
簡體中文 |
| zh-Hans |
簡體中文 |
| zh-Hant |
繁體中文 |
ImageDetail
指出要傳回哪些網域特定詳細資料的字串。
| 值 | Description |
|---|---|
| celebrities |
細節公認為名人。 |
| landmarks |
細節被認為是地標。 |
IndexProjectionMode
定義索引投影相對於索引子其餘部分的行為。
| 值 | Description |
|---|---|
| skipIndexingParentDocuments |
來源檔將會略過寫入索引子的目標索引。 |
| includeIndexingParentDocuments |
來源文件將會寫入索引子的目標索引。 這是預設模式。 |
InputFieldMappingEntry
技能的輸入欄位對應。
| 名稱 | 類型 | Description |
|---|---|---|
| inputs |
建立複雜類型時使用的遞迴輸入。 |
|
| name |
string |
輸入的名稱。 |
| source |
string |
輸入的來源。 |
| sourceContext |
string |
用於選取遞迴輸入的來源內容。 |
KeyPhraseExtractionSkill
使用文字分析進行關鍵片語擷取的技能。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultLanguageCode |
指出要使用的語言程式碼的值。 預設值為 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| maxKeyPhraseCount |
integer (int32) |
一個數字,表示要傳回多少個關鍵詞組。 如果不存在,將傳回所有已識別的關鍵詞組。 |
| modelVersion |
string |
呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。 |
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
KeyPhraseExtractionSkillLanguage
KeyPhraseExtractionSkill 支援輸入文字的語言代碼。
| 值 | Description |
|---|---|
| da |
Danish |
| nl |
Dutch |
| en |
English |
| fi |
Finnish |
| fr |
法語 |
| de |
德語 |
| it |
義大利語 |
| ja |
日語 |
| ko |
朝鮮語 |
| no |
挪威語(博克馬爾) |
| pl |
波蘭語 |
| pt-PT |
葡萄牙文 (葡萄牙) |
| pt-BR |
葡萄牙文 (巴西) |
| ru |
Russian |
| es |
西班牙文 |
| sv |
Swedish |
LanguageDetectionSkill
一種技能,可偵測輸入文字的語言,並為請求提交的每個文件報告單一語言代碼。 語言代碼與指示分析信賴度的分數配對。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultCountryHint |
string |
國家/地區代碼,如果語言偵測模型無法消除語言歧義,則可用作語言偵測模型的提示。 |
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| modelVersion |
string |
呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。 |
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
LineEnding
定義要在 OCR 技能識別的文字行之間使用的字元順序。 預設值為「space」。
| 值 | Description |
|---|---|
| space |
行以單一空格字元分隔。 |
| carriageReturn |
行會以回車 ('\r') 字元分隔。 |
| lineFeed |
行由單一換行 ('\n') 字元分隔。 |
| carriageReturnLineFeed |
行會以回車符和換行 ('\r\n') 字元分隔。 |
MergeSkill
將兩個或多個字串合併為單一統一字串的技能,並使用可選的使用者定義分隔符號來分隔每個元件部分。
| 名稱 | 類型 | 預設值 | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
|
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
|
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
||
| insertPostTag |
string |
標籤表示合併文字的結尾。 依預設,標籤是空白空間。 |
|
| insertPreTag |
string |
標籤表示合併文字的開頭。 依預設,標籤是空白空間。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
|
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
OcrSkill
從圖像文件中提取文本的技能。
| 名稱 | 類型 | 預設值 | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
|
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
|
| defaultLanguageCode |
指出要使用的語言程式碼的值。 預設值為 |
||
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
|
| detectOrientation |
boolean |
False |
指示開啟或不開啟方向偵測的值。 預設值為 false。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
||
| lineEnding |
定義要在 OCR 技能識別的文字行之間使用的字元順序。 預設值為「space」。 |
||
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
|
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
OcrSkillLanguage
OcrSkill 支援輸入的語言代碼。
| 值 | Description |
|---|---|
| af |
Afrikaans |
| sq |
Albanian |
| anp |
昂加文 (梵文字母) |
| ar |
Arabic |
| ast |
阿斯圖裏亞斯文 |
| awa |
阿瓦德文 - 印度文 (梵文字母) |
| az |
亞塞拜然文 (拉丁) |
| bfy |
巴哥里文 |
| eu |
巴斯克文 |
| be |
白俄羅斯語(西里爾文和拉丁文) |
| be-cyrl |
白俄羅斯文 (斯拉夫) |
| be-latn |
白俄羅斯文 (拉丁) |
| bho |
博杰普爾文 - 印地文 (梵文字母) |
| bi |
比斯拉馬文 |
| brx |
霍文 (梵文字母) |
| bs |
波士尼亞文 (拉丁) |
| bra |
Brajbha |
| br |
布列塔尼文 |
| bg |
Bulgarian |
| bns |
Bundeli |
| bua |
布里亞特文 (斯拉夫) |
| ca |
加泰蘭文 |
| ceb |
Cebuano |
| rab |
查姆靈文 |
| ch |
查莫羅文 |
| hne |
恰蒂斯加爾文 (梵文字母) |
| zh-Hans |
簡體中文 |
| zh-Hant |
繁體中文 |
| kw |
康沃耳文 |
| co |
科西嘉文 |
| crh |
克里米亞韃靼文 (拉丁) |
| hr |
Croatian |
| cs |
Czech |
| da |
Danish |
| prs |
Dari |
| dhi |
狄摩文 (梵文字母) |
| doi |
多格拉文 (梵文字母) |
| nl |
Dutch |
| en |
English |
| myv |
厄爾茲亞文 (斯拉夫) |
| et |
Estonian |
| fo |
法羅文 |
| fj |
斐濟文 |
| fil |
Filipino |
| fi |
Finnish |
| fr |
法語 |
| fur |
弗魯連 |
| gag |
加告茲文 (拉丁) |
| gl |
加利西亞文 |
| de |
德語 |
| gil |
吉里巴斯文 |
| gon |
貢德文 (梵文字母) |
| el |
Greek |
| kl |
格陵蘭文 |
| gvr |
古隆文 (梵文字母) |
| ht |
海地克里奧爾文 |
| hlb |
亥比文 (梵文字母) |
| hni |
哈尼文 |
| bgc |
哈里亞納文 |
| haw |
夏威夷文 |
| hi |
印地語 |
| mww |
白苗文 (拉丁) |
| hoc |
Ho(梵文) |
| hu |
Hungarian |
| is |
Icelandic |
| smn |
伊納里薩米文 |
| id |
Indonesian |
| ia |
人工國際語 |
| iu |
伊努克提圖語(拉丁字母) |
| ga |
Irish |
| it |
義大利語 |
| ja |
日語 |
| Jns |
詹薩里文 (梵文字母) |
| jv |
爪哇文 |
| kea |
維德角文 |
| kac |
克欽文 (拉丁) |
| xnr |
康格里文 (梵文字母) |
| krc |
卡拉恰伊巴爾卡爾文 |
| kaa-cyrl |
卡拉卡爾帕克文 (斯拉夫) |
| kaa |
卡拉卡爾帕克文 (拉丁) |
| csb |
卡舒比文 |
| kk-cyrl |
哈薩克文 (斯拉夫) |
| kk-latn |
哈薩克文 (拉丁) |
| klr |
哈林文 |
| kha |
卡西文 |
| quc |
K'iche' |
| ko |
朝鮮語 |
| kfq |
科爾庫文 |
| kpy |
科里亞克文 |
| kos |
科斯雷文 |
| kum |
庫梅克文 (斯拉夫) |
| ku-arab |
庫德文 (阿拉伯文) |
| ku-latn |
庫德文 (拉丁) |
| kru |
庫魯克文 (梵文字母) |
| ky |
吉爾吉斯文 (斯拉夫) |
| lkt |
拉科塔文 |
| la |
拉丁文 |
| lt |
Lithuanian |
| dsb |
下索布文 |
| smj |
魯勒薩米文 |
| lb |
Luxembourgish |
| bfz |
馬哈蘇帕哈里文 (梵文字母) |
| ms |
馬來文 (拉丁) |
| mt |
Maltese |
| kmj |
馬爾托文 (梵文字母) |
| gv |
曼島文 |
| mi |
Maori |
| mr |
Marathi |
| mn |
蒙古文 (斯拉夫) |
| cnr-cyrl |
蒙特內哥羅文 (斯拉夫) |
| cnr-latn |
蒙特內哥羅文 (拉丁) |
| nap |
那不勒斯文 |
| ne |
尼泊爾文 |
| niu |
紐埃文 |
| nog |
諾蓋文 |
| sme |
北薩米文 (拉丁) |
| nb |
Norwegian |
| no |
Norwegian |
| oc |
奧克西坦文 |
| os |
奧塞提文 |
| ps |
普什圖文 |
| fa |
Persian |
| pl |
波蘭語 |
| pt |
Portuguese |
| pa |
旁遮普文 (阿拉伯文) |
| ksh |
利普里安文 |
| ro |
Romanian |
| rm |
羅曼斯文 |
| ru |
Russian |
| sck |
薩德里文 (梵文字母) |
| sm |
薩摩亞文 (拉丁) |
| sa |
梵文(梵文) |
| sat |
桑塔利(梵城) |
| sco |
蘇格蘭文 |
| gd |
蘇格蘭蓋爾文 |
| sr |
塞爾維亞文(拉丁文) |
| sr-Cyrl |
塞爾維亞文 (西里爾字母) |
| sr-Latn |
塞爾維亞文(拉丁文) |
| xsr |
夏爾巴文 (梵文字母) |
| srx |
西爾毛利文 (梵文字母) |
| sms |
斯科特薩米文 |
| sk |
Slovak |
| sl |
Slovenian |
| so |
索馬利文 (阿拉伯) |
| sma |
南薩米文 |
| es |
西班牙文 |
| sw |
史瓦希里文 (拉丁) |
| sv |
Swedish |
| tg |
塔吉克文 (西里爾) |
| tt |
韃靼文 (拉丁) |
| tet |
德頓文 |
| thf |
塔米文 |
| to |
東加文 |
| tr |
Turkish |
| tk |
土庫曼文 (拉丁) |
| tyv |
圖瓦文 |
| hsb |
上索布文 |
| ur |
Urdu |
| ug |
維吾爾文 (阿拉伯) |
| uz-arab |
烏茲別克文 (阿拉伯文) |
| uz-cyrl |
烏茲別克文 (斯拉夫) |
| uz |
烏茲別克文 (拉丁) |
| vo |
沃拉普克文 |
| wae |
瓦瑟文 |
| cy |
Welsh |
| fy |
西弗里西亞文 |
| yua |
猶加敦馬雅文 |
| za |
壯文 |
| zu |
袓魯文 |
| unk |
未知(全部) |
OutputFieldMappingEntry
技能的輸出欄位對應。
| 名稱 | 類型 | Description |
|---|---|---|
| name |
string |
技能所定義的輸出名稱。 |
| targetName |
string |
輸出的目標名稱。 它是選用的,預設為名稱。 |
PIIDetectionSkill
使用文字分析 API,從輸入文字擷取個人資訊,並為您提供遮罩它的選項。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultLanguageCode |
string |
指出要使用的語言程式碼的值。 預設值為 |
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| domain |
string |
如果指定,則會將 PII 網域設定為僅包含實體類別的子集。 可能的值包括:「phi」、「none」。 預設值為「無」。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| maskingCharacter |
string maxLength: 1 |
如果 maskingMode 參數設定為取代,則用來遮罩文字的字元。 預設值為 '*'。 |
| maskingMode |
提供各種方式來遮罩輸入文字中偵測到的個人資訊的參數。 預設值為「無」。 |
|
| minimumPrecision |
number (double) minimum: 0maximum: 1 |
介於 0 和 1 之間的值,用於僅包含信賴度分數大於指定值的實體。 如果未設定 (預設值),或明確設定為 null,則會包含所有實體。 |
| modelVersion |
string |
呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。 |
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
|
| piiCategories |
string[] |
應擷取和遮罩的 PII 實體類別清單。 |
PIIDetectionSkillMaskingMode
一個字串,指出要使用的 maskingMode 來遮罩輸入文字中偵測到的個人資訊。
| 值 | Description |
|---|---|
| none |
不會發生遮罩,且不會傳回 maskedText 輸出。 |
| replace |
將偵測到的實體取代為 maskingCharacter 參數中指定的字元。 字元將重複到偵測到的實體的長度,以便位移量將正確對應於輸入文字和輸出 maskedText。 |
SearchIndexerDataNoneIdentity
清除資料來源的身分識別屬性。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定身分類型的 URI 片段。 |
SearchIndexerDataUserAssignedIdentity
指定要使用的資料來源身分識別。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定身分類型的 URI 片段。 |
| userAssignedIdentity |
string |
使用者指派受控識別的完整 Azure 資源識別碼,通常採用「/subscriptions/12345678-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId」格式,應該已指派給搜尋服務。 |
SearchIndexerIndexProjections
定義二級搜尋索引的其他投影。
| 名稱 | 類型 | Description |
|---|---|---|
| parameters |
索引投影特定組態屬性的字典。 每個名稱都是特定屬性的名稱。 每個值都必須是基本類型。 |
|
| selectors |
要對次要搜尋索引執行的投影清單。 |
SearchIndexerIndexProjectionSelector
要儲存在指定搜尋索引中的資料的說明。
| 名稱 | 類型 | Description |
|---|---|---|
| mappings |
投影的對應,或哪個來源應該對應至目標索引中的哪個欄位。 |
|
| parentKeyFieldName |
string |
搜尋索引中要將父文件索引鍵值對應至的欄位名稱。 必須是可篩選的字串欄位,而不是索引鍵欄位。 |
| sourceContext |
string |
投影的來源內容。 代表文件將分割成多個子文件的基數。 |
| targetIndexName |
string |
要投影到的搜尋索引名稱。 必須具有已設定「關鍵字」分析器的索引鍵欄位。 |
SearchIndexerIndexProjectionsParameters
索引投影特定組態屬性的字典。 每個名稱都是特定屬性的名稱。 每個值都必須是基本類型。
| 名稱 | 類型 | Description |
|---|---|---|
| projectionMode |
定義索引投影相對於索引子其餘部分的行為。 |
SearchIndexerKnowledgeStore
定義擴充資料的 Azure Blob、資料表或檔案的其他投影。
| 名稱 | 類型 | Description |
|---|---|---|
| projections |
索引期間要執行的其他投影清單。 |
|
| storageConnectionString |
string |
儲存體帳戶投影的連接字串將會儲存在其中。 |
SearchIndexerKnowledgeStoreFileProjectionSelector
要儲存在 Azure 檔案儲存體中的資料的投影定義。
| 名稱 | 類型 | Description |
|---|---|---|
| generatedKeyName |
string |
要儲存投影的產生金鑰名稱。 |
| inputs |
複雜投影的巢狀輸入。 |
|
| referenceKeyName |
string |
不同投影的參考鍵名稱。 |
| source |
string |
將資料來源設為專案。 |
| sourceContext |
string |
複雜投影的來源內容。 |
| storageContainer |
string |
Blob 容器,以儲存投影。 |
SearchIndexerKnowledgeStoreObjectProjectionSelector
要儲存在 Azure Blob 中的資料的投影定義。
| 名稱 | 類型 | Description |
|---|---|---|
| generatedKeyName |
string |
要儲存投影的產生金鑰名稱。 |
| inputs |
複雜投影的巢狀輸入。 |
|
| referenceKeyName |
string |
不同投影的參考鍵名稱。 |
| source |
string |
將資料來源設為專案。 |
| sourceContext |
string |
複雜投影的來源內容。 |
| storageContainer |
string |
Blob 容器,以儲存投影。 |
SearchIndexerKnowledgeStoreProjection
各種投影選取器的容器物件。
| 名稱 | 類型 | Description |
|---|---|---|
| files |
投影至 Azure 檔案儲存體。 |
|
| objects |
投影至 Azure Blob 儲存體。 |
|
| tables |
Azure 資料表儲存體的投影。 |
SearchIndexerKnowledgeStoreTableProjectionSelector
要儲存在 Azure 資料表中的資料描述。
| 名稱 | 類型 | Description |
|---|---|---|
| generatedKeyName |
string |
要儲存投影的產生金鑰名稱。 |
| inputs |
複雜投影的巢狀輸入。 |
|
| referenceKeyName |
string |
不同投影的參考鍵名稱。 |
| source |
string |
將資料來源設為專案。 |
| sourceContext |
string |
複雜投影的來源內容。 |
| tableName |
string |
要儲存投影資料的 Azure 資料表名稱。 |
SearchIndexerSkillset
技能清單。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.etag |
string |
技能組的 ETag。 |
| cognitiveServices | CognitiveServicesAccount: |
執行技能時要使用的 Azure AI 服務的詳細數據。 |
| description |
string |
技能組的描述。 |
| encryptionKey |
您在 Azure 金鑰保存庫中建立的加密金鑰描述。 當您想要完全保證沒有人 (甚至 Microsoft) 無法解密您的技能集定義時,此金鑰可用來為您的技能組定義提供額外的待用加密層級。 加密技能組定義之後,它一律會保持加密狀態。 搜尋服務會忽略嘗試將此屬性設定為 Null。 如果您想要輪替加密金鑰,您可以視需要變更此屬性;您的技能組合定義將不受影響。 使用客戶管理的金鑰進行加密不適用於免費搜尋服務,且僅適用於 2019 年 1 月 1 日或之後建立的付費服務。 |
|
| indexProjections |
對二級搜索索引的額外預測的定義。 |
|
| knowledgeStore |
定義擴充資料的 Azure Blob、資料表或檔案的其他投影。 |
|
| name |
string |
技能集的名稱。 |
| skills |
SearchIndexerSkill[]:
|
技能集中的技能清單。 |
SearchResourceEncryptionKey
Azure Key Vault 中的客戶管理加密金鑰。 您建立和管理的金鑰可用來加密或解密靜態資料,例如索引和同義字對映。
| 名稱 | 類型 | Description |
|---|---|---|
| accessCredentials |
用來存取 Azure 金鑰保存庫的選擇性 Azure Active Directory 認證。 如果改用受控識別,則不需要。 |
|
| keyVaultKeyName |
string |
要用來加密待用資料的 Azure 金鑰保存庫名稱。 |
| keyVaultKeyVersion |
string |
要用來加密待用資料的 Azure 金鑰版本。 |
| keyVaultUri |
string |
Azure 金鑰保存庫的 URI,也稱為 DNS 名稱,其中包含要用來加密待用資料的金鑰。 範例 URI 可能是 |
SentimentSkill
此技能已被取代。 使用 V3。SentimentSkill 的
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultLanguageCode |
指出要使用的語言程式碼的值。 預設值為 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
SentimentSkillLanguage
Deprecated. SentimentSkill 支援輸入文字的語言代碼。
| 值 | Description |
|---|---|
| da |
Danish |
| nl |
Dutch |
| en |
English |
| fi |
Finnish |
| fr |
法語 |
| de |
德語 |
| el |
Greek |
| it |
義大利語 |
| no |
挪威語(博克馬爾) |
| pl |
波蘭語 |
| pt-PT |
葡萄牙文 (葡萄牙) |
| ru |
Russian |
| es |
西班牙文 |
| sv |
Swedish |
| tr |
Turkish |
SentimentSkillV3
使用文字分析 API,評估非結構化文字,並針對每筆記錄,根據服務在句子和文件層級找到的最高信賴分數,提供情緒標籤 (例如「負面」、「中性」和「正面」)。
| 名稱 | 類型 | 預設值 | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
|
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
|
| defaultLanguageCode |
string |
指出要使用的語言程式碼的值。 預設值為 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
|
| includeOpinionMining |
boolean |
False |
如果設定為 true,技能輸出將包含來自文字分析的資訊,以進行意見採礦,也就是文字中的目標 (名詞或動詞) 及其相關聯的評定 (形容詞) 。 預設值為 false。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
||
| modelVersion |
string |
呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
|
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
ShaperSkill
重塑輸出的技能。 它會建立複雜類型來支援複合欄位 (也稱為多部分欄位)。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
SplitSkill
將字串分割成文字區塊的技能。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultLanguageCode |
指出要使用的語言程式碼的值。 預設值為 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| maximumPageLength |
integer (int32) |
所需的頁面長度上限。 預設值為 10000。 |
| maximumPagesToTake |
integer (int32) |
僅適用於 textSplitMode 設定為 'pages' 時。 如果指定,SplitSkill 將在處理第一個「maximumPagesToTake」頁面後停止分割,以便在每個文件只需要幾個初始頁面時提高效能。 |
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
|
| pageOverlapLength |
integer (int32) |
僅適用於 textSplitMode 設定為 'pages' 時。 如果指定,則第 n+1 個區塊將從第 n 個區塊結尾開始以此字元/記號數開始。 |
| textSplitMode |
指出要執行的分割模式的值。 |
SplitSkillLanguage
SplitSkill 支援輸入文字的語言代碼。
| 值 | Description |
|---|---|
| am |
Amharic |
| bs |
Bosnian |
| cs |
Czech |
| da |
Danish |
| de |
德語 |
| en |
English |
| es |
西班牙文 |
| et |
Estonian |
| fi |
Finnish |
| fr |
法語 |
| he |
希伯來文 |
| hi |
印地語 |
| hr |
Croatian |
| hu |
Hungarian |
| id |
Indonesian |
| is |
Icelandic |
| it |
義大利語 |
| ja |
日語 |
| ko |
朝鮮語 |
| lv |
Latvian |
| nb |
Norwegian |
| nl |
Dutch |
| pl |
波蘭語 |
| pt |
葡萄牙文 (葡萄牙) |
| pt-br |
葡萄牙文 (巴西) |
| ru |
Russian |
| sk |
Slovak |
| sl |
Slovenian |
| sr |
Serbian |
| sv |
Swedish |
| tr |
Turkish |
| ur |
Urdu |
| zh |
中文(簡體) |
TextSplitMode
指出要執行的分割模式的值。
| 值 | Description |
|---|---|
| pages |
將文字分割成個別頁面。 |
| sentences |
將文本拆分為單獨的句子。 |
TextTranslationSkill
將文本從一種語言翻譯成另一種語言的技能。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| defaultFromLanguageCode |
對於未明確指定寄件者語言的文件,要從中翻譯文件的語言代碼。 |
|
| defaultToLanguageCode |
對於未明確指定至語言的文件,要將文件翻譯成的語言代碼。 |
|
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
|
| suggestedFrom |
當未提供 fromLanguageCode 輸入或 defaultFromLanguageCode 參數,且自動語言偵測失敗時,要從中翻譯文件的語言代碼。 預設值為 |
TextTranslationSkillLanguage
TextTranslationSkill 支援輸入文字的語言代碼。
| 值 | Description |
|---|---|
| af |
Afrikaans |
| ar |
Arabic |
| bn |
孟加拉文 |
| bs |
波士尼亞文 (拉丁文) |
| bg |
Bulgarian |
| yue |
粵語 (繁體中文) |
| ca |
加泰蘭文 |
| zh-Hans |
簡體中文 |
| zh-Hant |
繁體中文 |
| hr |
Croatian |
| cs |
Czech |
| da |
Danish |
| nl |
Dutch |
| en |
English |
| et |
Estonian |
| fj |
斐濟文 |
| fil |
Filipino |
| fi |
Finnish |
| fr |
法語 |
| de |
德語 |
| el |
Greek |
| ht |
海地克里奧爾文 |
| he |
希伯來文 |
| hi |
印地語 |
| mww |
白苗文 |
| hu |
Hungarian |
| is |
Icelandic |
| id |
Indonesian |
| it |
義大利語 |
| ja |
日語 |
| sw |
Kiswahili |
| tlh |
克林貢文 |
| tlh-Latn |
克林貢語(拉丁文字) |
| tlh-Piqd |
克林貢語(克林貢文字) |
| ko |
朝鮮語 |
| lv |
Latvian |
| lt |
Lithuanian |
| mg |
馬達加斯加文 |
| ms |
Malay |
| mt |
Maltese |
| nb |
Norwegian |
| fa |
Persian |
| pl |
波蘭語 |
| pt |
Portuguese |
| pt-br |
葡萄牙文 (巴西) |
| pt-PT |
葡萄牙文 (葡萄牙) |
| otq |
克雷塔羅歐多蜜文 |
| ro |
Romanian |
| ru |
Russian |
| sm |
薩摩亞文 |
| sr-Cyrl |
塞爾維亞文 (西里爾字母) |
| sr-Latn |
塞爾維亞文(拉丁文) |
| sk |
Slovak |
| sl |
Slovenian |
| es |
西班牙文 |
| sv |
Swedish |
| ty |
大溪地文 |
| ta |
Tamil |
| te |
Telugu |
| th |
Thai |
| to |
東加文 |
| tr |
Turkish |
| uk |
烏克蘭文 |
| ur |
Urdu |
| vi |
Vietnamese |
| cy |
Welsh |
| yua |
猶加敦馬雅文 |
| ga |
Irish |
| kn |
Kannada |
| mi |
Maori |
| ml |
Malayalam |
| pa |
Punjabi |
VisualFeature
指出要傳回哪些視覺功能類型的字串。
| 值 | Description |
|---|---|
| adult |
被視為成年人的視覺特徵。 |
| brands |
視覺特徵被公認為商業品牌。 |
| categories |
類別。 |
| description |
Description. |
| faces |
視覺特徵被識別為人臉。 |
| objects |
視覺特徵被識別為物件。 |
| tags |
標籤。 |
WebApiSkill
可呼叫 Web API 端點的技能,可讓您藉由呼叫自訂程式碼來擴充技能集。
| 名稱 | 類型 | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
指定技能類型的 URI 片段。 |
| authIdentity | SearchIndexerDataIdentity: |
用於輸出連線的使用者指派受控識別。 如果提供 authResourceId 且未指定,則會使用系統指派的受控識別。 在索引子更新時,如果未指定身分識別,則值會保持不變。 如果設定為 “none”,則會清除此屬性的值。 |
| authResourceId |
string |
適用於連線到 Azure 函式中外部程式碼的自訂技能,或提供轉換的其他應用程式。 此值應該是向 Azure Active Directory 註冊時針對函式或應用程式建立的應用程式識別碼。 指定時,自訂技能會使用搜尋服務的受控識別碼 (系統或使用者指派) 和函式或應用程式的存取權杖連線到函式或應用程式,並使用此值作為建立存取權杖範圍的資源識別碼。 |
| batchSize |
integer (int32) |
所需的批次大小,表示文件數目。 |
| context |
string |
代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。 |
| degreeOfParallelism |
integer (int32) |
如果設定,則可對 Web API 進行的平行呼叫數目。 |
| description |
string |
技能的描述,描述技能的輸入、輸出和使用方式。 |
| httpHeaders |
object |
發出 http 要求所需的標頭。 |
| httpMethod |
string |
http 要求的方法。 |
| inputs |
技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。 |
|
| name |
string |
在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。 |
| outputs |
技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。 |
|
| timeout |
string (duration) |
要求所需的逾時。 預設值為 30 秒。 |
| uri |
string |
Web API 的 URL。 |