BinaryQuantizationCompression interface
包含二進位量化壓縮方法在編製索引和查詢期間所使用的組態選項。
- Extends
屬性
| kind | 多型歧視性,指定這個物件可以是的不同類型 |
繼承的屬性
| compression |
要與此特定組態產生關聯的名稱。 |
| default |
默認過度取樣因數。 在初始搜尋中,過度取樣會在內部要求更多檔(由這個乘數指定)。 這會增加從全精確度向量使用重新計算相似度分數來重新產生的結果集。 最小值為 1,表示沒有過度取樣(1 倍)。 只有在 rerankWithOriginalVectors 為 true 時,才能設定此參數。 較高的值會犧牲延遲來改善召回率。 |
| rerank |
如果設定為 true,一旦取得使用壓縮向量計算的已排序結果集之後,就會重新計算完整精確度相似度分數來重新調整結果集。 這會以犧牲延遲為代價來改善召回率。 |
| rescoring |
包含重新記錄的選項。 |
| truncation |
要截斷向量的維度數目。 截斷向量可減少向量的大小,以及搜尋期間需要傳輸的數據量。 這可以節省記憶體成本,並降低搜尋效能,以犧牲召回率。 它只應該用於內嵌使用 Matryoshka 表示法學習 (MRL) 定型的內嵌,例如 OpenAI 文字內嵌-3-large(小型)。 默認值為 null,這表示不會截斷。 |
屬性詳細資料
kind
多型歧視性,指定這個物件可以是的不同類型
kind: "binaryQuantization"
屬性值
"binaryQuantization"
繼承的屬性詳細資料
compressionName
defaultOversampling
默認過度取樣因數。 在初始搜尋中,過度取樣會在內部要求更多檔(由這個乘數指定)。 這會增加從全精確度向量使用重新計算相似度分數來重新產生的結果集。 最小值為 1,表示沒有過度取樣(1 倍)。 只有在 rerankWithOriginalVectors 為 true 時,才能設定此參數。 較高的值會犧牲延遲來改善召回率。
defaultOversampling?: number
屬性值
number
rerankWithOriginalVectors
如果設定為 true,一旦取得使用壓縮向量計算的已排序結果集之後,就會重新計算完整精確度相似度分數來重新調整結果集。 這會以犧牲延遲為代價來改善召回率。
rerankWithOriginalVectors?: boolean
屬性值
boolean
rescoringOptions
包含重新記錄的選項。
rescoringOptions?: RescoringOptions
屬性值
truncationDimension
要截斷向量的維度數目。 截斷向量可減少向量的大小,以及搜尋期間需要傳輸的數據量。 這可以節省記憶體成本,並降低搜尋效能,以犧牲召回率。 它只應該用於內嵌使用 Matryoshka 表示法學習 (MRL) 定型的內嵌,例如 OpenAI 文字內嵌-3-large(小型)。 默認值為 null,這表示不會截斷。
truncationDimension?: number
屬性值
number