SplitSkill interface
Uma habilidade para dividir uma cadeia de caracteres em partes de texto.
- Extends
Propriedades
| azure |
Aplica-se somente se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'. |
| default |
Um valor que indica qual código de idioma usar. O padrão é |
| maximum |
Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão depois de processar as primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento. |
| max |
O comprimento máximo de página desejado. O padrão é 10000. |
| odatatype | Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser |
| page |
Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final da nth chunk. |
| text |
Um valor que indica qual modo de divisão executar. |
| unit | Aplica-se somente se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá o comprimento (maximumPageLength e pageOverlapLength). O padrão é "caracteres", o que significa que o comprimento será medido por caractere. |
Propriedades herdadas
| context | Representa o nível em que as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document. |
| description | A descrição da habilidade que descreve as entradas, as saídas e o uso da habilidade. |
| inputs | As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade upstream. |
| name | O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixado com o caractere '#'. |
| outputs | A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como entrada por outra habilidade. |
Detalhes da propriedade
azureOpenAITokenizerParameters
Aplica-se somente se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'.
azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters
Valor da propriedade
defaultLanguageCode
Um valor que indica qual código de idioma usar. O padrão é en.
defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
Valor da propriedade
"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
maximumPagesToTake
Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão depois de processar as primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento.
maximumPagesToTake?: number
Valor da propriedade
number
maxPageLength
O comprimento máximo de página desejado. O padrão é 10000.
maxPageLength?: number
Valor da propriedade
number
odatatype
Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser
odatatype: "#Microsoft.Skills.Text.SplitSkill"
Valor da propriedade
"#Microsoft.Skills.Text.SplitSkill"
pageOverlapLength
Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final da nth chunk.
pageOverlapLength?: number
Valor da propriedade
number
textSplitMode
Um valor que indica qual modo de divisão executar.
textSplitMode?: "pages" | "sentences"
Valor da propriedade
"pages" | "sentences"
unit
Aplica-se somente se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá o comprimento (maximumPageLength e pageOverlapLength). O padrão é "caracteres", o que significa que o comprimento será medido por caractere.
unit?: string
Valor da propriedade
string
Detalhes das propriedades herdadas
context
Representa o nível em que as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document.
context?: string
Valor da propriedade
string
Herdado deSearchIndexerSkill.context
description
A descrição da habilidade que descreve as entradas, as saídas e o uso da habilidade.
description?: string
Valor da propriedade
string
Herdado deSearchIndexerSkill.description
inputs
As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade upstream.
inputs: InputFieldMappingEntry[]
Valor da propriedade
Herdado deSearchIndexerSkill.inputs
name
O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixado com o caractere '#'.
name?: string
Valor da propriedade
string
Herdado deSearchIndexerSkill.name
outputs
A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como entrada por outra habilidade.
outputs: OutputFieldMappingEntry[]
Valor da propriedade
Herdado deSearchIndexerSkill.outputs