共用方式為


Skillsets - Create

在搜尋服務中建立新的技能集。

POST {endpoint}/skillsets?api-version=2025-09-01

URI 參數

名稱 位於 必要 類型 Description
endpoint
path True

string

搜尋服務的端點 URL。

api-version
query True

string

用戶端 API 版本。

要求標頭

名稱 必要 類型 Description
x-ms-client-request-id

string (uuid)

隨請求一起傳送的追蹤 ID,以協助偵錯。

要求本文

名稱 必要 類型 Description
name True

string

技能集的名稱。

skills True SearchIndexerSkill[]:

技能集中的技能清單。

@odata.etag

string

技能組的 ETag。

cognitiveServices CognitiveServicesAccount:

執行技能時要使用的 Azure AI 服務的詳細數據。

description

string

技能組的描述。

encryptionKey

SearchResourceEncryptionKey

您在 Azure 金鑰保存庫中建立的加密金鑰描述。 當您想要完全保證沒有人 (甚至 Microsoft) 無法解密您的技能集定義時,此金鑰可用來為您的技能組定義提供額外的待用加密層級。 加密技能組定義之後,它一律會保持加密狀態。 搜尋服務會忽略嘗試將此屬性設定為 Null。 如果您想要輪替加密金鑰,您可以視需要變更此屬性;您的技能組合定義將不受影響。 使用客戶管理的金鑰進行加密不適用於免費搜尋服務,且僅適用於 2019 年 1 月 1 日或之後建立的付費服務。

indexProjections

SearchIndexerIndexProjections

對二級搜索索引的額外預測的定義。

knowledgeStore

SearchIndexerKnowledgeStore

定義擴充資料的 Azure Blob、資料表或檔案的其他投影。

回應

名稱 類型 Description
201 Created

SearchIndexerSkillset

技能組合已成功建立。

Other Status Codes

ErrorResponse

錯誤回應。

範例

SearchServiceCreateSkillset

範例要求

POST https://stableexampleservice.search.windows.net/skillsets?api-version=2025-09-01


{
  "name": "tempskillset",
  "description": "Skillset for extracting entities and more",
  "skills": [
    {
      "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
      "name": "skill2",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content"
        },
        {
          "name": "countryHint",
          "source": "/document/countryHint"
        }
      ],
      "outputs": [
        {
          "name": "languageCode",
          "targetName": "languageCode"
        }
      ]
    },
    {
      "textSplitMode": "pages",
      "maximumPageLength": 4000,
      "@odata.type": "#Microsoft.Skills.Text.SplitSkill",
      "name": "skill3",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content"
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode"
        }
      ],
      "outputs": [
        {
          "name": "textItems",
          "targetName": "pages"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
      "name": "skill4",
      "context": "/document/pages/*",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content"
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode"
        }
      ],
      "outputs": [
        {
          "name": "keyPhrases",
          "targetName": "keyPhrases"
        }
      ]
    },
    {
      "uri": "https://contoso.example.org/",
      "httpMethod": "POST",
      "timeout": "PT5S",
      "@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
      "name": "skill5",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content"
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode"
        }
      ],
      "outputs": [
        {
          "name": "customresult",
          "targetName": "result"
        }
      ]
    },
    {
      "outputMode": "oneToMany",
      "markdownHeaderDepth": "h3",
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "name": "docIntelligenceLayoutSkill",
      "context": "/document",
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/content"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document",
          "targetName": "markdown_document"
        }
      ]
    },
    {
      "outputFormat": "text",
      "outputMode": "oneToMany",
      "extractionOptions": [
        "images",
        "locationMetadata"
      ],
      "chunkingProperties": {
        "unit": "characters",
        "maximumLength": 500,
        "overlapLength": 50
      },
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "name": "docIntelligenceLayoutSkill#2",
      "context": "/document",
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/content"
        }
      ],
      "outputs": [
        {
          "name": "text_sections",
          "targetName": "text_sections"
        },
        {
          "name": "normalized_images",
          "targetName": "normalized_images"
        }
      ]
    }
  ],
  "cognitiveServices": {
    "@odata.type": "#Microsoft.Azure.Search.DefaultCognitiveServices",
    "description": "Description of the Azure AI service resource attached to a skillset"
  },
  "@odata.etag": "0x1234568AE7E58A1"
}

範例回覆

{
  "@odata.etag": "0x1234568AE7E58A1",
  "name": "tempskillset",
  "description": "Skillset for extracting entities and more",
  "skills": [
    {
      "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
      "name": "skill2",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "countryHint",
          "source": "/document/countryHint",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "languageCode",
          "targetName": "languageCode"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.SplitSkill",
      "name": "skill3",
      "textSplitMode": "pages",
      "maximumPageLength": 4000,
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "textItems",
          "targetName": "pages"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
      "name": "skill4",
      "context": "/document/pages/*",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "keyPhrases",
          "targetName": "keyPhrases"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
      "name": "skill5",
      "uri": "https://contoso.example.org/",
      "httpMethod": "POST",
      "timeout": "PT5S",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "customresult",
          "targetName": "result"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "name": "docIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany",
      "markdownHeaderDepth": "h3",
      "extractionOptions": [],
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/content",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "markdown_document",
          "targetName": "markdown_document"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "name": "docIntelligenceLayoutSkill#2",
      "context": "/document",
      "outputMode": "oneToMany",
      "outputFormat": "text",
      "extractionOptions": [
        "images",
        "locationMetadata"
      ],
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/content",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "text_sections",
          "targetName": "text_sections"
        },
        {
          "name": "normalized_images",
          "targetName": "normalized_images"
        }
      ],
      "chunkingProperties": {
        "unit": "characters",
        "maximumLength": 500,
        "overlapLength": 50
      }
    }
  ],
  "cognitiveServices": {
    "@odata.type": "#Microsoft.Azure.Search.DefaultCognitiveServices",
    "description": "Description of the Azure AI service resource attached to a skillset"
  }
}

定義

名稱 Description
AzureActiveDirectoryApplicationCredentials

針對搜尋服務建立之已註冊應用程式認證,用於對儲存在 Azure 金鑰保存庫中的加密金鑰進行驗證存取。

AzureOpenAIEmbeddingSkill

可讓您使用 Azure OpenAI 資源為指定的文字輸入產生向量內嵌。

AzureOpenAIModelName

將呼叫的 Azure Open AI 模型名稱。

CognitiveServicesAccountKey

附加至技能組之 Azure AI 服務資源的多區域帳戶金鑰。

ConditionalSkill

一種技能,可讓需要布林運算的案例來決定要指派給輸出的資料。

CustomEntity

包含找到之相符項目的相關資訊,以及相關中繼資料的物件。

CustomEntityAlias

可用來指定根實體名稱的替代拼字或同義字的複雜物件。

CustomEntityLookupSkill

技能會從自訂的使用者定義的單字和片語清單中尋找文字。

CustomEntityLookupSkillLanguage

CustomEntityLookupSkill 支援輸入文字的語言代碼。

DefaultCognitiveServicesAccount

空白物件,代表技能組的預設 Azure AI 服務資源。

DocumentExtractionSkill

從擴充管線內的檔案擷取內容的技能。

DocumentIntelligenceLayoutSkill

透過 Azure AI 服務從擴充管線內的檔案擷取內容和版面配置資訊的技能。

DocumentIntelligenceLayoutSkillChunkingProperties

控制區塊化內容的基數。

DocumentIntelligenceLayoutSkillChunkingUnit

控制 chunk unit 的基數。 預設值為「字元」

DocumentIntelligenceLayoutSkillExtractionOptions

控制技能從文件擷取的內容基數。

DocumentIntelligenceLayoutSkillMarkdownHeaderDepth

Markdown 輸出中標頭的深度。 預設值為 h6。

DocumentIntelligenceLayoutSkillOutputFormat

控制輸出格式的基數。 預設值為「降價」。

DocumentIntelligenceLayoutSkillOutputMode

控制技能所產生的輸出基數。 預設值為 'oneToMany'。

EntityCategory

指出要傳回哪些實體類別的字串。

EntityLinkingSkill

使用文字分析 API,從文字擷取連結的實體。

EntityRecognitionSkill

此技能已被取代。 使用 V3。EntityRecognitionSkill 的技能。

EntityRecognitionSkillLanguage

Deprecated. EntityRecognitionSkill 支援輸入文字的語言代碼。

EntityRecognitionSkillV3

使用文字分析 API,從文字擷取不同類型的實體。

ErrorAdditionalInfo

資源管理錯誤其他資訊。

ErrorDetail

錯誤詳細數據。

ErrorResponse

錯誤回應

ImageAnalysisSkill

分析影像檔案的技能。 它根據圖像內容提取一組豐富的視覺特徵。

ImageAnalysisSkillLanguage

ImageAnalysisSkill 支援輸入的語言代碼。

ImageDetail

指出要傳回哪些網域特定詳細資料的字串。

IndexProjectionMode

定義索引投影相對於索引子其餘部分的行為。

InputFieldMappingEntry

技能的輸入欄位對應。

KeyPhraseExtractionSkill

使用文字分析進行關鍵片語擷取的技能。

KeyPhraseExtractionSkillLanguage

KeyPhraseExtractionSkill 支援輸入文字的語言代碼。

LanguageDetectionSkill

一種技能,可偵測輸入文字的語言,並為請求提交的每個文件報告單一語言代碼。 語言代碼與指示分析信賴度的分數配對。

LineEnding

定義要在 OCR 技能識別的文字行之間使用的字元順序。 預設值為「space」。

MergeSkill

將兩個或多個字串合併為單一統一字串的技能,並使用可選的使用者定義分隔符號來分隔每個元件部分。

OcrSkill

從圖像文件中提取文本的技能。

OcrSkillLanguage

OcrSkill 支援輸入的語言代碼。

OutputFieldMappingEntry

技能的輸出欄位對應。

PIIDetectionSkill

使用文字分析 API,從輸入文字擷取個人資訊,並為您提供遮罩它的選項。

PIIDetectionSkillMaskingMode

一個字串,指出要使用的 maskingMode 來遮罩輸入文字中偵測到的個人資訊。

SearchIndexerDataNoneIdentity

清除資料來源的身分識別屬性。

SearchIndexerDataUserAssignedIdentity

指定要使用的資料來源身分識別。

SearchIndexerIndexProjections

定義二級搜尋索引的其他投影。

SearchIndexerIndexProjectionSelector

要儲存在指定搜尋索引中的資料的說明。

SearchIndexerIndexProjectionsParameters

索引投影特定組態屬性的字典。 每個名稱都是特定屬性的名稱。 每個值都必須是基本類型。

SearchIndexerKnowledgeStore

定義擴充資料的 Azure Blob、資料表或檔案的其他投影。

SearchIndexerKnowledgeStoreFileProjectionSelector

要儲存在 Azure 檔案儲存體中的資料的投影定義。

SearchIndexerKnowledgeStoreObjectProjectionSelector

要儲存在 Azure Blob 中的資料的投影定義。

SearchIndexerKnowledgeStoreProjection

各種投影選取器的容器物件。

SearchIndexerKnowledgeStoreTableProjectionSelector

要儲存在 Azure 資料表中的資料描述。

SearchIndexerSkillset

技能清單。

SearchResourceEncryptionKey

Azure Key Vault 中的客戶管理加密金鑰。 您建立和管理的金鑰可用來加密或解密靜態資料,例如索引和同義字對映。

SentimentSkill

此技能已被取代。 使用 V3。SentimentSkill 的

SentimentSkillLanguage

Deprecated. SentimentSkill 支援輸入文字的語言代碼。

SentimentSkillV3

使用文字分析 API,評估非結構化文字,並針對每筆記錄,根據服務在句子和文件層級找到的最高信賴分數,提供情緒標籤 (例如「負面」、「中性」和「正面」)。

ShaperSkill

重塑輸出的技能。 它會建立複雜類型來支援複合欄位 (也稱為多部分欄位)。

SplitSkill

將字串分割成文字區塊的技能。

SplitSkillLanguage

SplitSkill 支援輸入文字的語言代碼。

TextSplitMode

指出要執行的分割模式的值。

TextTranslationSkill

將文本從一種語言翻譯成另一種語言的技能。

TextTranslationSkillLanguage

TextTranslationSkill 支援輸入文字的語言代碼。

VisualFeature

指出要傳回哪些視覺功能類型的字串。

WebApiSkill

可呼叫 Web API 端點的技能,可讓您藉由呼叫自訂程式碼來擴充技能集。

AzureActiveDirectoryApplicationCredentials

針對搜尋服務建立之已註冊應用程式認證,用於對儲存在 Azure 金鑰保存庫中的加密金鑰進行驗證存取。

名稱 類型 Description
applicationId

string

已授與 Azure 金鑰保存庫所需存取權限的 AAD 應用程式識別碼,可在加密待用資料時使用。 應用程式識別碼不應與 AAD 應用程式的物件識別碼混淆。

applicationSecret

string

指定 AAD 應用程式的驗證金鑰。

AzureOpenAIEmbeddingSkill

可讓您使用 Azure OpenAI 資源為指定的文字輸入產生向量內嵌。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill

指定技能類型的 URI 片段。

apiKey

string

指定 Azure OpenAI 資源的 API 金鑰。

authIdentity SearchIndexerDataIdentity:

用於輸出連線的使用者指派受控識別。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

deploymentId

string

指定資源上 Azure OpenAI 模型部署的識別碼。

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

dimensions

integer (int32)

產生的輸出內嵌應具有的維度數目。 僅在 text-embedding-3 和更新版本中支援。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

modelName

AzureOpenAIModelName

部署在提供的 deploymentId 路徑上的內嵌模型名稱。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

resourceUri

string (uri)

Azure OpenAI 資源的資源 URI。

AzureOpenAIModelName

將呼叫的 Azure Open AI 模型名稱。

Description
text-embedding-ada-002
text-embedding-3-large
text-embedding-3-small

CognitiveServicesAccountKey

附加至技能組之 Azure AI 服務資源的多區域帳戶金鑰。

名稱 類型 Description
@odata.type string:

#Microsoft.Azure.Search.CognitiveServicesByKey

指定附加至技能組的 Azure AI 服務資源類型的 URI 片段。

description

string

附加至技能組的 Azure AI 服務資源描述。

key

string

用來佈建附加至技能組的 Azure AI 服務資源的金鑰。

ConditionalSkill

一種技能,可讓需要布林運算的案例來決定要指派給輸出的資料。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Util.ConditionalSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

CustomEntity

包含找到之相符項目的相關資訊,以及相關中繼資料的物件。

名稱 類型 Description
accentSensitive

boolean

預設為 False。 布林值,表示與實體名稱的比較是否應該對重音敏感。

aliases

CustomEntityAlias[]

複雜物件陣列,可用來指定根實體名稱的替代拼字或同義字。

caseSensitive

boolean

預設為 False。 布林值,表示與實體名稱的比較是否應該對字元大小寫敏感。 「Microsoft」 的不區分大小寫的比對範例可能是:microsoft、microSoft、MICROSOFT。

defaultAccentSensitive

boolean

變更此實體的預設重音敏感度值。 它用於更改所有別名的默認值 accentSensitive 值。

defaultCaseSensitive

boolean

變更此實體的預設區分大小寫值。 它用來變更所有別名 caseSensitive 值的預設值。

defaultFuzzyEditDistance

integer (int32)

變更此圖元的預設模糊編輯距離值。 它可用來變更所有別名 fuzzyEditDistance 值的預設值。

description

string

此欄位可用作有關匹配文本的自定義中繼資料的傳遞。 此欄位的值將與技能輸出中其實體的每次匹配一起顯示。

fuzzyEditDistance

integer (int32)

預設為 0。 最大值為 5。 表示仍會與實體名稱相符的可接受不同字元數目。 會傳回任何指定相符專案的最小可能模糊度。 例如,如果編輯距離設定為 3,則「Windows10」仍會符合「Windows」、「Windows10」和「Windows 7」。 當區分大小寫設定為 false 時,大小差異不會計入模糊容錯,但其他方面會計入。

id

string

此欄位可用作有關匹配文本的自定義中繼資料的傳遞。 此欄位的值將與技能輸出中其實體的每次匹配一起顯示。

name

string

最上層實體描述元。 技能輸出中的相符項目將依此名稱分組,並且它應該代表所找到的文字的「標準化」形式。

subtype

string

此欄位可用作有關匹配文本的自定義中繼資料的傳遞。 此欄位的值將與技能輸出中其實體的每次匹配一起顯示。

type

string

此欄位可用作有關匹配文本的自定義中繼資料的傳遞。 此欄位的值將與技能輸出中其實體的每次匹配一起顯示。

CustomEntityAlias

可用來指定根實體名稱的替代拼字或同義字的複雜物件。

名稱 類型 Description
accentSensitive

boolean

判斷別名是否敏感於重音。

caseSensitive

boolean

判斷別名是否區分大小寫。

fuzzyEditDistance

integer (int32)

決定別名的模糊編輯距離。

text

string

別名的文字。

CustomEntityLookupSkill

技能會從自訂的使用者定義的單字和片語清單中尋找文字。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.CustomEntityLookupSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

CustomEntityLookupSkillLanguage

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

entitiesDefinitionUri

string

JSON 或 CSV 檔案的路徑,其中包含要比對的所有目標文字。 此實體定義會在索引子執行開始時讀取。 在索引子執行期間,此檔案的任何更新都不會在後續執行之前生效。 此設定必須可透過HTTPS存取。

globalDefaultAccentSensitive

boolean

AccentSensitive 的全球旗幟。 如果未在 CustomEntity 中設定 AccentSensitive,則此值會是預設值。

globalDefaultCaseSensitive

boolean

CaseSensitive 的全域旗標。 如果未在 CustomEntity 中設定 CaseSensity,則此值會是預設值。

globalDefaultFuzzyEditDistance

integer (int32)

FuzzyEditDistance 的全域旗標。 如果未在 CustomEntity 中設定 FuzzyEditDistance,則此值會是預設值。

inlineEntitiesDefinition

CustomEntity[]

內嵌 CustomEntity 定義。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

CustomEntityLookupSkillLanguage

CustomEntityLookupSkill 支援輸入文字的語言代碼。

Description
da

Danish

de

德語

en

English

es

西班牙文

fi

Finnish

fr

法語

it

義大利語

ko

朝鮮語

pt

Portuguese

DefaultCognitiveServicesAccount

空白物件,代表技能組的預設 Azure AI 服務資源。

名稱 類型 Description
@odata.type string:

#Microsoft.Azure.Search.DefaultCognitiveServices

指定附加至技能組的 Azure AI 服務資源類型的 URI 片段。

description

string

附加至技能組的 Azure AI 服務資源描述。

DocumentExtractionSkill

從擴充管線內的檔案擷取內容的技能。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Util.DocumentExtractionSkill

指定技能類型的 URI 片段。

configuration

object

技能設定的字典。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

dataToExtract

string

要為技能擷取的資料類型。 如果未定義,將設定為 'contentAndMetadata'。

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

parsingMode

string

技能的 parsingMode。 如果未定義,將設定為「預設」。

DocumentIntelligenceLayoutSkill

透過 Azure AI 服務從擴充管線內的檔案擷取內容和版面配置資訊的技能。

名稱 類型 預設值 Description
@odata.type string:

#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

指定技能類型的 URI 片段。

chunkingProperties

DocumentIntelligenceLayoutSkillChunkingProperties

控制區塊化內容的基數。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

extractionOptions

DocumentIntelligenceLayoutSkillExtractionOptions[]

控制技能從文件擷取的內容基數

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

markdownHeaderDepth

DocumentIntelligenceLayoutSkillMarkdownHeaderDepth

h6

Markdown 輸出中標頭的深度。 預設值為 h6。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputFormat

DocumentIntelligenceLayoutSkillOutputFormat

markdown

控制輸出格式的基數。 預設值為「降價」。

outputMode

DocumentIntelligenceLayoutSkillOutputMode

oneToMany

控制技能所產生的輸出基數。 預設值為 'oneToMany'。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

DocumentIntelligenceLayoutSkillChunkingProperties

控制區塊化內容的基數。

名稱 類型 預設值 Description
maximumLength

integer (int32)

區塊長度上限(以字元為單位)。 預設值為 500。

overlapLength

integer (int32)

在兩個文本塊之間提供的重疊長度。 預設值為 0。

unit

DocumentIntelligenceLayoutSkillChunkingUnit

characters

區塊的單位。

DocumentIntelligenceLayoutSkillChunkingUnit

控制 chunk unit 的基數。 預設值為「字元」

Description
characters

依字元指定區塊。

DocumentIntelligenceLayoutSkillExtractionOptions

控制技能從文件擷取的內容基數。

Description
images

指定應從文件中擷取影像內容。

locationMetadata

指定應從文件中擷取位置中繼資料。

DocumentIntelligenceLayoutSkillMarkdownHeaderDepth

Markdown 輸出中標頭的深度。 預設值為 h6。

Description
h1

標頭層級 1。

h2

標頭層級 2。

h3

標頭層級 3。

h4

標頭層級 4。

h5

標頭等級 5。

h6

標頭層級 6。

DocumentIntelligenceLayoutSkillOutputFormat

控制輸出格式的基數。 預設值為「降價」。

Description
text

將輸出的格式指定為文字。

markdown

將輸出的格式指定為 markdown。

DocumentIntelligenceLayoutSkillOutputMode

控制技能所產生的輸出基數。 預設值為 'oneToMany'。

Description
oneToMany

指定輸出應該剖解析為 'oneToMany'。

EntityCategory

指出要傳回哪些實體類別的字串。

Description
location

描述實體位置的實體。

organization

描述組織的實體。

person

描述一個人的實體。

quantity

描述數量的實體。

datetime

描述日期和時間的實體。

url

描述 URL 的實體。

email

描述電子郵件地址的實體。

EntityLinkingSkill

使用文字分析 API,從文字擷取連結的實體。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.V3.EntityLinkingSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

string

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

minimumPrecision

number (double)

minimum: 0
maximum: 1

介於 0 和 1 之間的值,用於僅包含信賴度分數大於指定值的實體。 如果未設定 (預設值),或明確設定為 null,則會包含所有實體。

modelVersion

string

呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

EntityRecognitionSkill

此技能已被取代。 使用 V3。EntityRecognitionSkill 的技能。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.EntityRecognitionSkill

指定技能類型的 URI 片段。

categories

EntityCategory[]

應擷取的實體類別清單。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

EntityRecognitionSkillLanguage

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

includeTypelessEntities

boolean

決定是否包含已知但不符合預先定義類型的實體。 如果未設定此組態 (預設值)、設定為 null 或設定為 false,則不會顯示不符合其中一個預先定義類型的實體。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

minimumPrecision

number (double)

介於 0 和 1 之間的值,用於僅包含信賴度分數大於指定值的實體。 如果未設定 (預設值),或明確設定為 null,則會包含所有實體。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

EntityRecognitionSkillLanguage

Deprecated. EntityRecognitionSkill 支援輸入文字的語言代碼。

Description
ar

Arabic

cs

Czech

zh-Hans

簡體中文

zh-Hant

Chinese-Traditional

da

Danish

nl

Dutch

en

English

fi

Finnish

fr

法語

de

德語

el

Greek

hu

Hungarian

it

義大利語

ja

日語

ko

朝鮮語

no

挪威語(博克馬爾)

pl

波蘭語

pt-PT

葡萄牙文 (葡萄牙)

pt-BR

葡萄牙文 (巴西)

ru

Russian

es

西班牙文

sv

Swedish

tr

Turkish

EntityRecognitionSkillV3

使用文字分析 API,從文字擷取不同類型的實體。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.V3.EntityRecognitionSkill

指定技能類型的 URI 片段。

categories

string[]

應擷取的實體類別清單。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

string

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

minimumPrecision

number (double)

minimum: 0
maximum: 1

介於 0 和 1 之間的值,用於僅包含信賴度分數大於指定值的實體。 如果未設定 (預設值),或明確設定為 null,則會包含所有實體。

modelVersion

string

呼叫文字分析 API 時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

ErrorAdditionalInfo

資源管理錯誤其他資訊。

名稱 類型 Description
info

object

其他資訊。

type

string

其他信息類型。

ErrorDetail

錯誤詳細數據。

名稱 類型 Description
additionalInfo

ErrorAdditionalInfo[]

錯誤其他資訊。

code

string

錯誤碼。

details

ErrorDetail[]

錯誤詳細數據。

message

string

錯誤訊息。

target

string

錯誤目標。

ErrorResponse

錯誤回應

名稱 類型 Description
error

ErrorDetail

error 物件。

ImageAnalysisSkill

分析影像檔案的技能。 它根據圖像內容提取一組豐富的視覺特徵。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Vision.ImageAnalysisSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

ImageAnalysisSkillLanguage

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

details

ImageDetail[]

指出要傳回哪些網域特定詳細資料的字串。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

visualFeatures

VisualFeature[]

視覺功能清單。

ImageAnalysisSkillLanguage

ImageAnalysisSkill 支援輸入的語言代碼。

Description
ar

Arabic

az

亞塞拜然文

bg

Bulgarian

bs

波士尼亞文 (拉丁)

ca

加泰蘭文

cs

Czech

cy

Welsh

da

Danish

de

德語

el

Greek

en

English

es

西班牙文

et

Estonian

eu

巴斯克文

fi

Finnish

fr

法語

ga

Irish

gl

加利西亞文

he

希伯來文

hi

印地語

hr

Croatian

hu

Hungarian

id

Indonesian

it

義大利語

ja

日語

kk

Kazakh

ko

朝鮮語

lt

Lithuanian

lv

Latvian

mk

Macedonian

ms

馬來文 (馬來西亞)

nb

挪威文 (巴克摩)

nl

Dutch

pl

波蘭語

prs

Dari

pt-BR

葡萄牙文 (巴西)

pt

葡萄牙文 (葡萄牙)

pt-PT

葡萄牙文 (葡萄牙)

ro

Romanian

ru

Russian

sk

Slovak

sl

Slovenian

sr-Cyrl

塞爾維亞文 (斯拉夫 RS)

sr-Latn

塞爾維亞文 (拉丁 RS)

sv

Swedish

th

Thai

tr

Turkish

uk

烏克蘭文

vi

Vietnamese

zh

簡體中文

zh-Hans

簡體中文

zh-Hant

繁體中文

ImageDetail

指出要傳回哪些網域特定詳細資料的字串。

Description
celebrities

細節公認為名人。

landmarks

細節被認為是地標。

IndexProjectionMode

定義索引投影相對於索引子其餘部分的行為。

Description
skipIndexingParentDocuments

來源檔將會略過寫入索引子的目標索引。

includeIndexingParentDocuments

來源文件將會寫入索引子的目標索引。 這是預設模式。

InputFieldMappingEntry

技能的輸入欄位對應。

名稱 類型 Description
inputs

InputFieldMappingEntry[]

建立複雜類型時使用的遞迴輸入。

name

string

輸入的名稱。

source

string

輸入的來源。

sourceContext

string

用於選取遞迴輸入的來源內容。

KeyPhraseExtractionSkill

使用文字分析進行關鍵片語擷取的技能。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.KeyPhraseExtractionSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

KeyPhraseExtractionSkillLanguage

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

maxKeyPhraseCount

integer (int32)

一個數字,表示要傳回多少個關鍵詞組。 如果不存在,將傳回所有已識別的關鍵詞組。

modelVersion

string

呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

KeyPhraseExtractionSkillLanguage

KeyPhraseExtractionSkill 支援輸入文字的語言代碼。

Description
da

Danish

nl

Dutch

en

English

fi

Finnish

fr

法語

de

德語

it

義大利語

ja

日語

ko

朝鮮語

no

挪威語(博克馬爾)

pl

波蘭語

pt-PT

葡萄牙文 (葡萄牙)

pt-BR

葡萄牙文 (巴西)

ru

Russian

es

西班牙文

sv

Swedish

LanguageDetectionSkill

一種技能,可偵測輸入文字的語言,並為請求提交的每個文件報告單一語言代碼。 語言代碼與指示分析信賴度的分數配對。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.LanguageDetectionSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultCountryHint

string

國家/地區代碼,如果語言偵測模型無法消除語言歧義,則可用作語言偵測模型的提示。

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

modelVersion

string

呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

LineEnding

定義要在 OCR 技能識別的文字行之間使用的字元順序。 預設值為「space」。

Description
space

行以單一空格字元分隔。

carriageReturn

行會以回車 ('\r') 字元分隔。

lineFeed

行由單一換行 ('\n') 字元分隔。

carriageReturnLineFeed

行會以回車符和換行 ('\r\n') 字元分隔。

MergeSkill

將兩個或多個字串合併為單一統一字串的技能,並使用可選的使用者定義分隔符號來分隔每個元件部分。

名稱 類型 預設值 Description
@odata.type string:

#Microsoft.Skills.Text.MergeSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

insertPostTag

string

標籤表示合併文字的結尾。 依預設,標籤是空白空間。

insertPreTag

string

標籤表示合併文字的開頭。 依預設,標籤是空白空間。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

OcrSkill

從圖像文件中提取文本的技能。

名稱 類型 預設值 Description
@odata.type string:

#Microsoft.Skills.Vision.OcrSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

OcrSkillLanguage

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

detectOrientation

boolean

False

指示開啟或不開啟方向偵測的值。 預設值為 false。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

lineEnding

LineEnding

定義要在 OCR 技能識別的文字行之間使用的字元順序。 預設值為「space」。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

OcrSkillLanguage

OcrSkill 支援輸入的語言代碼。

Description
af

Afrikaans

sq

Albanian

anp

昂加文 (梵文字母)

ar

Arabic

ast

阿斯圖裏亞斯文

awa

阿瓦德文 - 印度文 (梵文字母)

az

亞塞拜然文 (拉丁)

bfy

巴哥里文

eu

巴斯克文

be

白俄羅斯語(西里爾文和拉丁文)

be-cyrl

白俄羅斯文 (斯拉夫)

be-latn

白俄羅斯文 (拉丁)

bho

博杰普爾文 - 印地文 (梵文字母)

bi

比斯拉馬文

brx

霍文 (梵文字母)

bs

波士尼亞文 (拉丁)

bra

Brajbha

br

布列塔尼文

bg

Bulgarian

bns

Bundeli

bua

布里亞特文 (斯拉夫)

ca

加泰蘭文

ceb

Cebuano

rab

查姆靈文

ch

查莫羅文

hne

恰蒂斯加爾文 (梵文字母)

zh-Hans

簡體中文

zh-Hant

繁體中文

kw

康沃耳文

co

科西嘉文

crh

克里米亞韃靼文 (拉丁)

hr

Croatian

cs

Czech

da

Danish

prs

Dari

dhi

狄摩文 (梵文字母)

doi

多格拉文 (梵文字母)

nl

Dutch

en

English

myv

厄爾茲亞文 (斯拉夫)

et

Estonian

fo

法羅文

fj

斐濟文

fil

Filipino

fi

Finnish

fr

法語

fur

弗魯連

gag

加告茲文 (拉丁)

gl

加利西亞文

de

德語

gil

吉里巴斯文

gon

貢德文 (梵文字母)

el

Greek

kl

格陵蘭文

gvr

古隆文 (梵文字母)

ht

海地克里奧爾文

hlb

亥比文 (梵文字母)

hni

哈尼文

bgc

哈里亞納文

haw

夏威夷文

hi

印地語

mww

白苗文 (拉丁)

hoc

Ho(梵文)

hu

Hungarian

is

Icelandic

smn

伊納里薩米文

id

Indonesian

ia

人工國際語

iu

伊努克提圖語(拉丁字母)

ga

Irish

it

義大利語

ja

日語

Jns

詹薩里文 (梵文字母)

jv

爪哇文

kea

維德角文

kac

克欽文 (拉丁)

xnr

康格里文 (梵文字母)

krc

卡拉恰伊巴爾卡爾文

kaa-cyrl

卡拉卡爾帕克文 (斯拉夫)

kaa

卡拉卡爾帕克文 (拉丁)

csb

卡舒比文

kk-cyrl

哈薩克文 (斯拉夫)

kk-latn

哈薩克文 (拉丁)

klr

哈林文

kha

卡西文

quc

K'iche'

ko

朝鮮語

kfq

科爾庫文

kpy

科里亞克文

kos

科斯雷文

kum

庫梅克文 (斯拉夫)

ku-arab

庫德文 (阿拉伯文)

ku-latn

庫德文 (拉丁)

kru

庫魯克文 (梵文字母)

ky

吉爾吉斯文 (斯拉夫)

lkt

拉科塔文

la

拉丁文

lt

Lithuanian

dsb

下索布文

smj

魯勒薩米文

lb

Luxembourgish

bfz

馬哈蘇帕哈里文 (梵文字母)

ms

馬來文 (拉丁)

mt

Maltese

kmj

馬爾托文 (梵文字母)

gv

曼島文

mi

Maori

mr

Marathi

mn

蒙古文 (斯拉夫)

cnr-cyrl

蒙特內哥羅文 (斯拉夫)

cnr-latn

蒙特內哥羅文 (拉丁)

nap

那不勒斯文

ne

尼泊爾文

niu

紐埃文

nog

諾蓋文

sme

北薩米文 (拉丁)

nb

Norwegian

no

Norwegian

oc

奧克西坦文

os

奧塞提文

ps

普什圖文

fa

Persian

pl

波蘭語

pt

Portuguese

pa

旁遮普文 (阿拉伯文)

ksh

利普里安文

ro

Romanian

rm

羅曼斯文

ru

Russian

sck

薩德里文 (梵文字母)

sm

薩摩亞文 (拉丁)

sa

梵文(梵文)

sat

桑塔利(梵城)

sco

蘇格蘭文

gd

蘇格蘭蓋爾文

sr

塞爾維亞文(拉丁文)

sr-Cyrl

塞爾維亞文 (西里爾字母)

sr-Latn

塞爾維亞文(拉丁文)

xsr

夏爾巴文 (梵文字母)

srx

西爾毛利文 (梵文字母)

sms

斯科特薩米文

sk

Slovak

sl

Slovenian

so

索馬利文 (阿拉伯)

sma

南薩米文

es

西班牙文

sw

史瓦希里文 (拉丁)

sv

Swedish

tg

塔吉克文 (西里爾)

tt

韃靼文 (拉丁)

tet

德頓文

thf

塔米文

to

東加文

tr

Turkish

tk

土庫曼文 (拉丁)

tyv

圖瓦文

hsb

上索布文

ur

Urdu

ug

維吾爾文 (阿拉伯)

uz-arab

烏茲別克文 (阿拉伯文)

uz-cyrl

烏茲別克文 (斯拉夫)

uz

烏茲別克文 (拉丁)

vo

沃拉普克文

wae

瓦瑟文

cy

Welsh

fy

西弗里西亞文

yua

猶加敦馬雅文

za

壯文

zu

袓魯文

unk

未知(全部)

OutputFieldMappingEntry

技能的輸出欄位對應。

名稱 類型 Description
name

string

技能所定義的輸出名稱。

targetName

string

輸出的目標名稱。 它是選用的,預設為名稱。

PIIDetectionSkill

使用文字分析 API,從輸入文字擷取個人資訊,並為您提供遮罩它的選項。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.PIIDetectionSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

string

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

domain

string

如果指定,則會將 PII 網域設定為僅包含實體類別的子集。 可能的值包括:「phi」、「none」。 預設值為「無」。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

maskingCharacter

string

maxLength: 1

如果 maskingMode 參數設定為取代,則用來遮罩文字的字元。 預設值為 '*'。

maskingMode

PIIDetectionSkillMaskingMode

提供各種方式來遮罩輸入文字中偵測到的個人資訊的參數。 預設值為「無」。

minimumPrecision

number (double)

minimum: 0
maximum: 1

介於 0 和 1 之間的值,用於僅包含信賴度分數大於指定值的實體。 如果未設定 (預設值),或明確設定為 null,則會包含所有實體。

modelVersion

string

呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

piiCategories

string[]

應擷取和遮罩的 PII 實體類別清單。

PIIDetectionSkillMaskingMode

一個字串,指出要使用的 maskingMode 來遮罩輸入文字中偵測到的個人資訊。

Description
none

不會發生遮罩,且不會傳回 maskedText 輸出。

replace

將偵測到的實體取代為 maskingCharacter 參數中指定的字元。 字元將重複到偵測到的實體的長度,以便位移量將正確對應於輸入文字和輸出 maskedText。

SearchIndexerDataNoneIdentity

清除資料來源的身分識別屬性。

名稱 類型 Description
@odata.type string:

#Microsoft.Azure.Search.DataNoneIdentity

指定身分類型的 URI 片段。

SearchIndexerDataUserAssignedIdentity

指定要使用的資料來源身分識別。

名稱 類型 Description
@odata.type string:

#Microsoft.Azure.Search.DataUserAssignedIdentity

指定身分類型的 URI 片段。

userAssignedIdentity

string

使用者指派受控識別的完整 Azure 資源識別碼,通常採用「/subscriptions/12345678-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId」格式,應該已指派給搜尋服務。

SearchIndexerIndexProjections

定義二級搜尋索引的其他投影。

名稱 類型 Description
parameters

SearchIndexerIndexProjectionsParameters

索引投影特定組態屬性的字典。 每個名稱都是特定屬性的名稱。 每個值都必須是基本類型。

selectors

SearchIndexerIndexProjectionSelector[]

要對次要搜尋索引執行的投影清單。

SearchIndexerIndexProjectionSelector

要儲存在指定搜尋索引中的資料的說明。

名稱 類型 Description
mappings

InputFieldMappingEntry[]

投影的對應,或哪個來源應該對應至目標索引中的哪個欄位。

parentKeyFieldName

string

搜尋索引中要將父文件索引鍵值對應至的欄位名稱。 必須是可篩選的字串欄位,而不是索引鍵欄位。

sourceContext

string

投影的來源內容。 代表文件將分割成多個子文件的基數。

targetIndexName

string

要投影到的搜尋索引名稱。 必須具有已設定「關鍵字」分析器的索引鍵欄位。

SearchIndexerIndexProjectionsParameters

索引投影特定組態屬性的字典。 每個名稱都是特定屬性的名稱。 每個值都必須是基本類型。

名稱 類型 Description
projectionMode

IndexProjectionMode

定義索引投影相對於索引子其餘部分的行為。

SearchIndexerKnowledgeStore

定義擴充資料的 Azure Blob、資料表或檔案的其他投影。

名稱 類型 Description
projections

SearchIndexerKnowledgeStoreProjection[]

索引期間要執行的其他投影清單。

storageConnectionString

string

儲存體帳戶投影的連接字串將會儲存在其中。

SearchIndexerKnowledgeStoreFileProjectionSelector

要儲存在 Azure 檔案儲存體中的資料的投影定義。

名稱 類型 Description
generatedKeyName

string

要儲存投影的產生金鑰名稱。

inputs

InputFieldMappingEntry[]

複雜投影的巢狀輸入。

referenceKeyName

string

不同投影的參考鍵名稱。

source

string

將資料來源設為專案。

sourceContext

string

複雜投影的來源內容。

storageContainer

string

Blob 容器,以儲存投影。

SearchIndexerKnowledgeStoreObjectProjectionSelector

要儲存在 Azure Blob 中的資料的投影定義。

名稱 類型 Description
generatedKeyName

string

要儲存投影的產生金鑰名稱。

inputs

InputFieldMappingEntry[]

複雜投影的巢狀輸入。

referenceKeyName

string

不同投影的參考鍵名稱。

source

string

將資料來源設為專案。

sourceContext

string

複雜投影的來源內容。

storageContainer

string

Blob 容器,以儲存投影。

SearchIndexerKnowledgeStoreProjection

各種投影選取器的容器物件。

名稱 類型 Description
files

SearchIndexerKnowledgeStoreFileProjectionSelector[]

投影至 Azure 檔案儲存體。

objects

SearchIndexerKnowledgeStoreObjectProjectionSelector[]

投影至 Azure Blob 儲存體。

tables

SearchIndexerKnowledgeStoreTableProjectionSelector[]

Azure 資料表儲存體的投影。

SearchIndexerKnowledgeStoreTableProjectionSelector

要儲存在 Azure 資料表中的資料描述。

名稱 類型 Description
generatedKeyName

string

要儲存投影的產生金鑰名稱。

inputs

InputFieldMappingEntry[]

複雜投影的巢狀輸入。

referenceKeyName

string

不同投影的參考鍵名稱。

source

string

將資料來源設為專案。

sourceContext

string

複雜投影的來源內容。

tableName

string

要儲存投影資料的 Azure 資料表名稱。

SearchIndexerSkillset

技能清單。

名稱 類型 Description
@odata.etag

string

技能組的 ETag。

cognitiveServices CognitiveServicesAccount:

執行技能時要使用的 Azure AI 服務的詳細數據。

description

string

技能組的描述。

encryptionKey

SearchResourceEncryptionKey

您在 Azure 金鑰保存庫中建立的加密金鑰描述。 當您想要完全保證沒有人 (甚至 Microsoft) 無法解密您的技能集定義時,此金鑰可用來為您的技能組定義提供額外的待用加密層級。 加密技能組定義之後,它一律會保持加密狀態。 搜尋服務會忽略嘗試將此屬性設定為 Null。 如果您想要輪替加密金鑰,您可以視需要變更此屬性;您的技能組合定義將不受影響。 使用客戶管理的金鑰進行加密不適用於免費搜尋服務,且僅適用於 2019 年 1 月 1 日或之後建立的付費服務。

indexProjections

SearchIndexerIndexProjections

對二級搜索索引的額外預測的定義。

knowledgeStore

SearchIndexerKnowledgeStore

定義擴充資料的 Azure Blob、資料表或檔案的其他投影。

name

string

技能集的名稱。

skills SearchIndexerSkill[]:

技能集中的技能清單。

SearchResourceEncryptionKey

Azure Key Vault 中的客戶管理加密金鑰。 您建立和管理的金鑰可用來加密或解密靜態資料,例如索引和同義字對映。

名稱 類型 Description
accessCredentials

AzureActiveDirectoryApplicationCredentials

用來存取 Azure 金鑰保存庫的選擇性 Azure Active Directory 認證。 如果改用受控識別,則不需要。

keyVaultKeyName

string

要用來加密待用資料的 Azure 金鑰保存庫名稱。

keyVaultKeyVersion

string

要用來加密待用資料的 Azure 金鑰版本。

keyVaultUri

string

Azure 金鑰保存庫的 URI,也稱為 DNS 名稱,其中包含要用來加密待用資料的金鑰。 範例 URI 可能是 https://my-keyvault-name.vault.azure.net

SentimentSkill

此技能已被取代。 使用 V3。SentimentSkill 的

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.SentimentSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

SentimentSkillLanguage

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

SentimentSkillLanguage

Deprecated. SentimentSkill 支援輸入文字的語言代碼。

Description
da

Danish

nl

Dutch

en

English

fi

Finnish

fr

法語

de

德語

el

Greek

it

義大利語

no

挪威語(博克馬爾)

pl

波蘭語

pt-PT

葡萄牙文 (葡萄牙)

ru

Russian

es

西班牙文

sv

Swedish

tr

Turkish

SentimentSkillV3

使用文字分析 API,評估非結構化文字,並針對每筆記錄,根據服務在句子和文件層級找到的最高信賴分數,提供情緒標籤 (例如「負面」、「中性」和「正面」)。

名稱 類型 預設值 Description
@odata.type string:

#Microsoft.Skills.Text.V3.SentimentSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

string

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

includeOpinionMining

boolean

False

如果設定為 true,技能輸出將包含來自文字分析的資訊,以進行意見採礦,也就是文字中的目標 (名詞或動詞) 及其相關聯的評定 (形容詞) 。 預設值為 false。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

modelVersion

string

呼叫文字分析服務時要使用的模型版本。 未指定時,它將預設為最新的可用。 除非絕對必要,否則建議您不要指定此值。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

ShaperSkill

重塑輸出的技能。 它會建立複雜類型來支援複合欄位 (也稱為多部分欄位)。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Util.ShaperSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

SplitSkill

將字串分割成文字區塊的技能。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.SplitSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultLanguageCode

SplitSkillLanguage

指出要使用的語言程式碼的值。 預設值為 en

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

maximumPageLength

integer (int32)

所需的頁面長度上限。 預設值為 10000。

maximumPagesToTake

integer (int32)

僅適用於 textSplitMode 設定為 'pages' 時。 如果指定,SplitSkill 將在處理第一個「maximumPagesToTake」頁面後停止分割,以便在每個文件只需要幾個初始頁面時提高效能。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

pageOverlapLength

integer (int32)

僅適用於 textSplitMode 設定為 'pages' 時。 如果指定,則第 n+1 個區塊將從第 n 個區塊結尾開始以此字元/記號數開始。

textSplitMode

TextSplitMode

指出要執行的分割模式的值。

SplitSkillLanguage

SplitSkill 支援輸入文字的語言代碼。

Description
am

Amharic

bs

Bosnian

cs

Czech

da

Danish

de

德語

en

English

es

西班牙文

et

Estonian

fi

Finnish

fr

法語

he

希伯來文

hi

印地語

hr

Croatian

hu

Hungarian

id

Indonesian

is

Icelandic

it

義大利語

ja

日語

ko

朝鮮語

lv

Latvian

nb

Norwegian

nl

Dutch

pl

波蘭語

pt

葡萄牙文 (葡萄牙)

pt-br

葡萄牙文 (巴西)

ru

Russian

sk

Slovak

sl

Slovenian

sr

Serbian

sv

Swedish

tr

Turkish

ur

Urdu

zh

中文(簡體)

TextSplitMode

指出要執行的分割模式的值。

Description
pages

將文字分割成個別頁面。

sentences

將文本拆分為單獨的句子。

TextTranslationSkill

將文本從一種語言翻譯成另一種語言的技能。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Text.TranslationSkill

指定技能類型的 URI 片段。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

defaultFromLanguageCode

TextTranslationSkillLanguage

對於未明確指定寄件者語言的文件,要從中翻譯文件的語言代碼。

defaultToLanguageCode

TextTranslationSkillLanguage

對於未明確指定至語言的文件,要將文件翻譯成的語言代碼。

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

suggestedFrom

TextTranslationSkillLanguage

當未提供 fromLanguageCode 輸入或 defaultFromLanguageCode 參數,且自動語言偵測失敗時,要從中翻譯文件的語言代碼。 預設值為 en

TextTranslationSkillLanguage

TextTranslationSkill 支援輸入文字的語言代碼。

Description
af

Afrikaans

ar

Arabic

bn

孟加拉文

bs

波士尼亞文 (拉丁文)

bg

Bulgarian

yue

粵語 (繁體中文)

ca

加泰蘭文

zh-Hans

簡體中文

zh-Hant

繁體中文

hr

Croatian

cs

Czech

da

Danish

nl

Dutch

en

English

et

Estonian

fj

斐濟文

fil

Filipino

fi

Finnish

fr

法語

de

德語

el

Greek

ht

海地克里奧爾文

he

希伯來文

hi

印地語

mww

白苗文

hu

Hungarian

is

Icelandic

id

Indonesian

it

義大利語

ja

日語

sw

Kiswahili

tlh

克林貢文

tlh-Latn

克林貢語(拉丁文字)

tlh-Piqd

克林貢語(克林貢文字)

ko

朝鮮語

lv

Latvian

lt

Lithuanian

mg

馬達加斯加文

ms

Malay

mt

Maltese

nb

Norwegian

fa

Persian

pl

波蘭語

pt

Portuguese

pt-br

葡萄牙文 (巴西)

pt-PT

葡萄牙文 (葡萄牙)

otq

克雷塔羅歐多蜜文

ro

Romanian

ru

Russian

sm

薩摩亞文

sr-Cyrl

塞爾維亞文 (西里爾字母)

sr-Latn

塞爾維亞文(拉丁文)

sk

Slovak

sl

Slovenian

es

西班牙文

sv

Swedish

ty

大溪地文

ta

Tamil

te

Telugu

th

Thai

to

東加文

tr

Turkish

uk

烏克蘭文

ur

Urdu

vi

Vietnamese

cy

Welsh

yua

猶加敦馬雅文

ga

Irish

kn

Kannada

mi

Maori

ml

Malayalam

pa

Punjabi

VisualFeature

指出要傳回哪些視覺功能類型的字串。

Description
adult

被視為成年人的視覺特徵。

brands

視覺特徵被公認為商業品牌。

categories

類別。

description

Description.

faces

視覺特徵被識別為人臉。

objects

視覺特徵被識別為物件。

tags

標籤。

WebApiSkill

可呼叫 Web API 端點的技能,可讓您藉由呼叫自訂程式碼來擴充技能集。

名稱 類型 Description
@odata.type string:

#Microsoft.Skills.Custom.WebApiSkill

指定技能類型的 URI 片段。

authIdentity SearchIndexerDataIdentity:

用於輸出連線的使用者指派受控識別。 如果提供 authResourceId 且未指定,則會使用系統指派的受控識別。 在索引子更新時,如果未指定身分識別,則值會保持不變。 如果設定為 “none”,則會清除此屬性的值。

authResourceId

string

適用於連線到 Azure 函式中外部程式碼的自訂技能,或提供轉換的其他應用程式。 此值應該是向 Azure Active Directory 註冊時針對函式或應用程式建立的應用程式識別碼。 指定時,自訂技能會使用搜尋服務的受控識別碼 (系統或使用者指派) 和函式或應用程式的存取權杖連線到函式或應用程式,並使用此值作為建立存取權杖範圍的資源識別碼。

batchSize

integer (int32)

所需的批次大小,表示文件數目。

context

string

代表作業發生的層級,例如文件根目錄或文件內容 (例如,/document 或 /document/content)。 預設值為 /document。

degreeOfParallelism

integer (int32)

如果設定,則可對 Web API 進行的平行呼叫數目。

description

string

技能的描述,描述技能的輸入、輸出和使用方式。

httpHeaders

object

發出 http 要求所需的標頭。

httpMethod

string

http 要求的方法。

inputs

InputFieldMappingEntry[]

技能的輸入可以是來源資料集中的資料行,也可以是上游技能的輸出。

name

string

在技能集中唯一識別技能的技能名稱。 未定義名稱的技能將在技能陣列中獲得其從 1 開始的索引的預設名稱,並以字元「#」為前綴。

outputs

OutputFieldMappingEntry[]

技能的輸出是搜尋索引中的欄位,或可作為另一個技能輸入使用的值。

timeout

string (duration)

要求所需的逾時。 預設值為 30 秒。

uri

string

Web API 的 URL。