ScalarQuantizationCompression interface
Zawiera opcje konfiguracji specyficzne dla metody kompresji kwantyzacji skalarnej używanej podczas indeksowania i wykonywania zapytań.
- Rozszerzenie
Właściwości
| kind | Dyskryminujący polimorficzny, który określa różne typy tego obiektu może być |
| parameters | Zawiera parametry specyficzne dla kwantyzacji skalarnych. |
Właściwości dziedziczone
| compression |
Nazwa do skojarzenia z tą konkretną konfiguracją. |
| default |
Domyślny współczynnik oversampling. Oversampling będzie wewnętrznie żądać większej liczby dokumentów (określonych przez ten mnożnik) w początkowym wyszukiwaniu. Zwiększa to zestaw wyników, które zostaną ponownie sklasyfikowane przy użyciu wyników ponownej kompilacji wyników podobieństwa z wektorów o pełnej precyzji. Wartość minimalna to 1, co oznacza brak przeampowania (1x). Ten parametr można ustawić tylko wtedy, gdy parametr rerankWithOriginalVectors ma wartość true. Wyższe wartości zwiększają kompletność kosztem opóźnienia. |
| rerank |
Jeśli zostanie ustawiona wartość true, po uzyskaniu uporządkowanego zestawu wyników przy użyciu skompresowanych wektorów zostaną ponownie sklasyfikowane przez ponowne obliczenie wyników o pełnej precyzji. Poprawi to kompletność kosztem opóźnienia. |
| rescoring |
Zawiera opcje rescoringu. |
| truncation |
Liczba wymiarów do obcinania wektorów. Obcinanie wektorów zmniejsza rozmiar wektorów i ilość danych, które należy przesyłać podczas wyszukiwania. Może to zmniejszyć koszty magazynowania i zwiększyć wydajność wyszukiwania kosztem wycofania. Należy go używać tylko do osadzania wytrenowanych za pomocą uczenia reprezentacji matryoshka (MRL), takiego jak osadzanie tekstu OpenAI-3-large (małe). Wartość domyślna to null, co oznacza brak obcinania. |
Szczegóły właściwości
kind
Dyskryminujący polimorficzny, który określa różne typy tego obiektu może być
kind: "scalarQuantization"
Wartość właściwości
"scalarQuantization"
parameters
Zawiera parametry specyficzne dla kwantyzacji skalarnych.
parameters?: ScalarQuantizationParameters
Wartość właściwości
Szczegóły właściwości dziedziczonej
compressionName
Nazwa do skojarzenia z tą konkretną konfiguracją.
compressionName: string
Wartość właściwości
string
Odziedziczone poVectorSearchCompression.compressionName
defaultOversampling
Domyślny współczynnik oversampling. Oversampling będzie wewnętrznie żądać większej liczby dokumentów (określonych przez ten mnożnik) w początkowym wyszukiwaniu. Zwiększa to zestaw wyników, które zostaną ponownie sklasyfikowane przy użyciu wyników ponownej kompilacji wyników podobieństwa z wektorów o pełnej precyzji. Wartość minimalna to 1, co oznacza brak przeampowania (1x). Ten parametr można ustawić tylko wtedy, gdy parametr rerankWithOriginalVectors ma wartość true. Wyższe wartości zwiększają kompletność kosztem opóźnienia.
defaultOversampling?: number
Wartość właściwości
number
Odziedziczone poVectorSearchCompression.defaultOversampling
rerankWithOriginalVectors
Jeśli zostanie ustawiona wartość true, po uzyskaniu uporządkowanego zestawu wyników przy użyciu skompresowanych wektorów zostaną ponownie sklasyfikowane przez ponowne obliczenie wyników o pełnej precyzji. Poprawi to kompletność kosztem opóźnienia.
rerankWithOriginalVectors?: boolean
Wartość właściwości
boolean
Odziedziczone poVectorSearchCompression.rerankWithOriginalVectors
rescoringOptions
Zawiera opcje rescoringu.
rescoringOptions?: RescoringOptions
Wartość właściwości
Odziedziczone poVectorSearchCompression.rescoringOptions
truncationDimension
Liczba wymiarów do obcinania wektorów. Obcinanie wektorów zmniejsza rozmiar wektorów i ilość danych, które należy przesyłać podczas wyszukiwania. Może to zmniejszyć koszty magazynowania i zwiększyć wydajność wyszukiwania kosztem wycofania. Należy go używać tylko do osadzania wytrenowanych za pomocą uczenia reprezentacji matryoshka (MRL), takiego jak osadzanie tekstu OpenAI-3-large (małe). Wartość domyślna to null, co oznacza brak obcinania.
truncationDimension?: number
Wartość właściwości
number
Odziedziczone poVectorSearchCompression.truncationDimension