SplitSkill interface

Pacote:: @azure/search-documents

Uma habilidade para dividir uma cadeia de caracteres em partes de texto.

Extends: BaseSearchIndexerSkill

Propriedades

azureOpenAITokenizerParameters	Aplica-se somente se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'.
defaultLanguageCode	Um valor que indica qual código de idioma usar. O padrão é `en`.
maximumPagesToTake	Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão depois de processar as primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento.
maxPageLength	O comprimento máximo de página desejado. O padrão é 10000.
odatatype	Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser
pageOverlapLength	Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final da nth chunk.
textSplitMode	Um valor que indica qual modo de divisão executar.
unit	Aplica-se somente se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá o comprimento (maximumPageLength e pageOverlapLength). O padrão é "caracteres", o que significa que o comprimento será medido por caractere.

Propriedades herdadas

context	Representa o nível em que as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document.
description	A descrição da habilidade que descreve as entradas, as saídas e o uso da habilidade.
inputs	As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade upstream.
name	O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixado com o caractere '#'.
outputs	A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como entrada por outra habilidade.

Detalhes da propriedade

azureOpenAITokenizerParameters

Aplica-se somente se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'.

azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters

Valor da propriedade

AzureOpenAITokenizerParameters

defaultLanguageCode

Um valor que indica qual código de idioma usar. O padrão é en.

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

Valor da propriedade

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão depois de processar as primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento.

maximumPagesToTake?: number

Valor da propriedade

number

maxPageLength

O comprimento máximo de página desejado. O padrão é 10000.

maxPageLength?: number

Valor da propriedade

number

odatatype

Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser

odatatype: "#Microsoft.Skills.Text.SplitSkill"

Valor da propriedade

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final da nth chunk.

pageOverlapLength?: number

Valor da propriedade

number

textSplitMode

Um valor que indica qual modo de divisão executar.

textSplitMode?: "pages" | "sentences"

Valor da propriedade

"pages" | "sentences"

unit

Aplica-se somente se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá o comprimento (maximumPageLength e pageOverlapLength). O padrão é "caracteres", o que significa que o comprimento será medido por caractere.

unit?: string

Valor da propriedade

string

Detalhes das propriedades herdadas

context

Representa o nível em que as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document.

context?: string

Valor da propriedade

string

Herdado deSearchIndexerSkill.context

description

A descrição da habilidade que descreve as entradas, as saídas e o uso da habilidade.

description?: string

Valor da propriedade

string

Herdado deSearchIndexerSkill.description

inputs

As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade upstream.

inputs: InputFieldMappingEntry[]

Valor da propriedade

InputFieldMappingEntry[]

Herdado deSearchIndexerSkill.inputs

name

O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixado com o caractere '#'.

name?: string

Valor da propriedade

string

Herdado deSearchIndexerSkill.name

outputs

A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como entrada por outra habilidade.

outputs: OutputFieldMappingEntry[]

Valor da propriedade

OutputFieldMappingEntry[]

Herdado deSearchIndexerSkill.outputs

Comentários

Esta página foi útil?

Compartilhar via

SplitSkill interface

Propriedades

Propriedades herdadas

Detalhes da propriedade

azureOpenAITokenizerParameters

Valor da propriedade

defaultLanguageCode

Valor da propriedade

maximumPagesToTake

Valor da propriedade

maxPageLength

Valor da propriedade

odatatype

Valor da propriedade

pageOverlapLength

Valor da propriedade

textSplitMode

Valor da propriedade

unit

Valor da propriedade

Detalhes das propriedades herdadas

context

Valor da propriedade

description

Valor da propriedade

inputs

Valor da propriedade

name

Valor da propriedade

outputs

Valor da propriedade

Comentários