Partilhar via


ScalarQuantizationCompression interface

Contém opções de configuração específicas para o método de compressão de quantização escalar usado durante a indexação e consulta.

Extends

Propriedades

kind

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

parameters

Contém os parâmetros específicos da Quantização Escalar.

Propriedades Herdadas

compressionName

O nome a ser associado a essa configuração específica.

defaultOversampling

Fator de sobreamostragem padrão. A sobreamostragem solicitará internamente mais documentos (especificados por este multiplicador) na pesquisa inicial. Isso aumenta o conjunto de resultados que serão reclassificados usando pontuações de similaridade recalculadas de vetores de precisão total. O valor mínimo é 1, o que significa que não há sobreamostragem (1x). Este parâmetro só pode ser definido quando rerankWithOriginalVectors é true. Valores mais altos melhoram a recuperação em detrimento da latência.

rerankWithOriginalVectors

Se definido como true, uma vez obtido o conjunto ordenado de resultados calculados usando vetores compactados, eles serão reclassificados novamente recalculando as pontuações de similaridade de precisão total. Isso melhorará a recuperação em detrimento da latência.

rescoringOptions

Contém as opções para pontuação.

truncationDimension

O número de dimensões para truncar os vetores. Truncar os vetores reduz o tamanho dos vetores e a quantidade de dados que precisam ser transferidos durante a pesquisa. Isso pode economizar custos de armazenamento e melhorar o desempenho da pesquisa às custas da recuperação. Ele só deve ser usado para incorporações treinadas com Matryoshka Representation Learning (MRL), como OpenAI text-embedding-3-large (small). O valor padrão é null, o que significa que não há truncamento.

Detalhes de Propriedade

kind

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

kind: "scalarQuantization"

Valor de Propriedade

"scalarQuantization"

parameters

Contém os parâmetros específicos da Quantização Escalar.

parameters?: ScalarQuantizationParameters

Valor de Propriedade

Detalhes da Propriedade Herdada

compressionName

O nome a ser associado a essa configuração específica.

compressionName: string

Valor de Propriedade

string

Herdado deVectorSearchCompression.compressionName

defaultOversampling

Fator de sobreamostragem padrão. A sobreamostragem solicitará internamente mais documentos (especificados por este multiplicador) na pesquisa inicial. Isso aumenta o conjunto de resultados que serão reclassificados usando pontuações de similaridade recalculadas de vetores de precisão total. O valor mínimo é 1, o que significa que não há sobreamostragem (1x). Este parâmetro só pode ser definido quando rerankWithOriginalVectors é true. Valores mais altos melhoram a recuperação em detrimento da latência.

defaultOversampling?: number

Valor de Propriedade

number

Herdado deVectorSearchCompression.defaultOversampling

rerankWithOriginalVectors

Se definido como true, uma vez obtido o conjunto ordenado de resultados calculados usando vetores compactados, eles serão reclassificados novamente recalculando as pontuações de similaridade de precisão total. Isso melhorará a recuperação em detrimento da latência.

rerankWithOriginalVectors?: boolean

Valor de Propriedade

boolean

Herdado deVectorSearchCompression.rerankWithOriginalVectors

rescoringOptions

Contém as opções para pontuação.

rescoringOptions?: RescoringOptions

Valor de Propriedade

Herdado deVectorSearchCompression.rescoringOptions

truncationDimension

O número de dimensões para truncar os vetores. Truncar os vetores reduz o tamanho dos vetores e a quantidade de dados que precisam ser transferidos durante a pesquisa. Isso pode economizar custos de armazenamento e melhorar o desempenho da pesquisa às custas da recuperação. Ele só deve ser usado para incorporações treinadas com Matryoshka Representation Learning (MRL), como OpenAI text-embedding-3-large (small). O valor padrão é null, o que significa que não há truncamento.

truncationDimension?: number

Valor de Propriedade

number

Herdado deVectorSearchCompression.truncationDimension