共用方式為


BinaryQuantizationCompression interface

包含二進位量化壓縮方法在編製索引和查詢期間所使用的組態選項。

Extends

屬性

kind

多型歧視性,指定這個物件可以是的不同類型

繼承的屬性

compressionName

要與此特定組態產生關聯的名稱。

defaultOversampling

默認過度取樣因數。 在初始搜尋中,過度取樣會在內部要求更多檔(由這個乘數指定)。 這會增加從全精確度向量使用重新計算相似度分數來重新產生的結果集。 最小值為 1,表示沒有過度取樣(1 倍)。 只有在 rerankWithOriginalVectors 為 true 時,才能設定此參數。 較高的值會犧牲延遲來改善召回率。

rerankWithOriginalVectors

如果設定為 true,一旦取得使用壓縮向量計算的已排序結果集之後,就會重新計算完整精確度相似度分數來重新調整結果集。 這會以犧牲延遲為代價來改善召回率。

rescoringOptions

包含重新記錄的選項。

truncationDimension

要截斷向量的維度數目。 截斷向量可減少向量的大小,以及搜尋期間需要傳輸的數據量。 這可以節省記憶體成本,並降低搜尋效能,以犧牲召回率。 它只應該用於內嵌使用 Matryoshka 表示法學習 (MRL) 定型的內嵌,例如 OpenAI 文字內嵌-3-large(小型)。 默認值為 null,這表示不會截斷。

屬性詳細資料

kind

多型歧視性,指定這個物件可以是的不同類型

kind: "binaryQuantization"

屬性值

"binaryQuantization"

繼承的屬性詳細資料

compressionName

要與此特定組態產生關聯的名稱。

compressionName: string

屬性值

string

繼承自VectorSearchCompression.compressionName

defaultOversampling

默認過度取樣因數。 在初始搜尋中,過度取樣會在內部要求更多檔(由這個乘數指定)。 這會增加從全精確度向量使用重新計算相似度分數來重新產生的結果集。 最小值為 1,表示沒有過度取樣(1 倍)。 只有在 rerankWithOriginalVectors 為 true 時,才能設定此參數。 較高的值會犧牲延遲來改善召回率。

defaultOversampling?: number

屬性值

number

繼承自VectorSearchCompression.defaultOversampling

rerankWithOriginalVectors

如果設定為 true,一旦取得使用壓縮向量計算的已排序結果集之後,就會重新計算完整精確度相似度分數來重新調整結果集。 這會以犧牲延遲為代價來改善召回率。

rerankWithOriginalVectors?: boolean

屬性值

boolean

繼承自VectorSearchCompression.rerankWithOriginalVectors

rescoringOptions

包含重新記錄的選項。

rescoringOptions?: RescoringOptions

屬性值

繼承自VectorSearchCompression.rescoringOptions

truncationDimension

要截斷向量的維度數目。 截斷向量可減少向量的大小,以及搜尋期間需要傳輸的數據量。 這可以節省記憶體成本,並降低搜尋效能,以犧牲召回率。 它只應該用於內嵌使用 Matryoshka 表示法學習 (MRL) 定型的內嵌,例如 OpenAI 文字內嵌-3-large(小型)。 默認值為 null,這表示不會截斷。

truncationDimension?: number

屬性值

number

繼承自VectorSearchCompression.truncationDimension