Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describe cómo administrar de forma eficaz los costos al usar la búsqueda de vectores de IA de Mosaico. Se tratan los temas siguientes:
- Conceptos básicos del índice de búsqueda vectorial y del punto de conexión.
- Supervisión de la facturación y el uso.
- Modos de sincronización.
- Procedimientos recomendados para optimizar los costos.
Para identificar y eliminar puntos de conexión vacíos, consulte Identificación y eliminación de puntos de conexión de búsqueda de vectores vacíos.
Conceptos básicos de la búsqueda de vectores de IA de mosaico
La búsqueda vectorial de IA de mosaico se compone de:
- Índices de búsqueda vectorial: los índices almacenan los vectores para la búsqueda y recuperación.
- Puntos de conexión de búsqueda vectorial: cada punto de conexión hospeda uno o varios índices para atender consultas. Puede tener varios índices servidos en un único punto de conexión y un punto de conexión puede servir hasta 50 índices. En muchos casos, puede combinar cargas de trabajo más pequeñas en un único punto de conexión para reducir los costos totales.
Precio de la búsqueda de vectores
Databricks ofrece dos opciones de punto de conexión:
Puntos de conexión estándar. Una unidad de búsqueda vectorial cubre hasta 2 millones de vectores de dimensión 768 (o equivalente). Por ejemplo, si tiene 1 millón de vectores de dimensión 1536, también cuenta como una unidad.
Puntos de conexión optimizados para almacenamiento. Una unidad de búsqueda vectorial cubre hasta 64 millones de vectores de dimensión 768 (o equivalente).
Para ambas opciones, cada punto de conexión tiene un precio base y se escala verticalmente automáticamente para que coincida con el tamaño total de los índices que atiende.
- Los puntos de conexión estándar no escalan verticalmente automáticamente. Incluso si elimina vectores o reduce el tamaño de los índices, seguirá pagando por la mayor capacidad hasta que realice cambios manualmente.
- Los puntos de conexión optimizados para almacenamiento se reducen verticalmente automáticamente cuando se elimina un índice. El tamaño mínimo de un extremo es una unidad de búsqueda vectorial.
Importante
Los puntos de conexión estándar no escalan verticalmente automáticamente. Si el recuento de vectores disminuye significativamente (por ejemplo, de 4 millones a 1,5 millones de vectores), seguirá pagando por la mayor capacidad (dos unidades de búsqueda vectorial en este ejemplo) hasta que elimine el punto de conexión y cree uno nuevo. Esto solo es cierto para los puntos de conexión estándar. Los endpoints optimizados para almacenamiento se reducen automáticamente.
Supervisión del uso y los costos
Databricks proporciona una tabla de uso facturable, paneles de uso y directivas de presupuesto para ayudarle a supervisar el uso y los costos de la búsqueda de vectores.
Tabla de uso facturable
Este es un ejemplo de consulta de la tabla de uso facturable:
WITH all_vector_search_usage AS (
SELECT *,
CASE WHEN usage_metadata.endpoint_name IS NULL THEN 'ingest'
WHEN usage_type = "STORAGE_SPACE" THEN 'storage'
ELSE 'serving'
END as workload_type
FROM system.billing.usage
WHERE billing_origin_product = 'VECTOR_SEARCH'
),
daily_dbus AS (
SELECT
workspace_id,
cloud,
usage_date,
workload_type,
usage_metadata.endpoint_name as vector_search_endpoint,
CASE WHEN workload_type = 'serving' THEN SUM(usage_quantity)
WHEN workload_type = 'ingest' THEN SUM(usage_quantity)
ELSE null
END as dbus,
CASE WHEN workload_type = 'storage' THEN SUM(usage_quantity)
ELSE null
END as dsus
FROM all_vector_search_usage
GROUP BY 1,2,3,4,5
ORDER BY 1,2,3,4,5 DESC
)
SELECT * FROM daily_dbus;
Para obtener más información sobre la tabla de uso facturable, consulte la referencia de tabla del sistema de uso facturable.
Las consultas adicionales se encuentran en el siguiente cuaderno de ejemplo.
Cuaderno de consultas de tablas del sistema del vector de búsqueda
Paneles de uso
Para obtener información sobre los paneles de uso que puede importar para obtener información sobre los controladores de costos, incluido el uso de la búsqueda de vectores, consulte Paneles de uso.
Directivas presupuestarias
Las directivas de presupuesto permiten a los administradores agrupar y filtrar los registros de facturación en todos los productos sin servidor de Azure Databricks y proporcionar una interfaz de usuario dedicada para realizar el seguimiento de los gastos. Para obtener información sobre cómo aplicar una directiva de presupuesto a un punto de conexión de búsqueda vectorial, consulte Mosaic AI Vector Search: Budget policies (Búsqueda de vectores de IA de mosaico: directivas presupuestarias). Para obtener información general y detalles sobre cómo crear y administrar directivas de presupuesto, consulte Uso de atributos con directivas de presupuesto sin servidor.
Administración de los costos de sincronización de índices
Puede configurar el índice para que se actualice de dos maneras:
- Sincronización desencadenada: llame a la API o al SDK de Python para desencadenar una actualización de índice. Esta es la opción más rentable.
- Sincronización continua: el índice se actualiza automáticamente con los cambios de la tabla delta de origen con una latencia casi en tiempo real. Esto cuesta más porque se aprovisiona un clúster de streaming para controlar la sincronización. Si las actualizaciones casi en tiempo real con segundos de latencia no son críticas, considere la posibilidad de usar la sincronización desencadenada para reducir los costos.
Procedimientos recomendados para la administración de costos
- Combinar cargas de trabajo en un único punto de conexión: si prevé un QPS bajo en todos los índices, puede combinar los índices en un único punto de conexión para evitar varios costos de punto de conexión base. Consulte la guía de rendimiento de búsqueda vectorial para obtener más detalles.
- Supervisión del uso: use las tablas de facturación del sistema y los paneles de uso integrados para realizar un seguimiento de la capacidad, el uso y los costos.
- Para los puntos de conexión estándar, reduzca manualmente: como se explicó anteriormente, para los puntos de conexión estándar, debe eliminar el punto y volver a crearlo si el recuento de vectores está por debajo de un umbral de capacidad anterior que ya no necesita. Los puntos de conexión optimizados para almacenamiento se reducen verticalmente automáticamente cuando se elimina un índice.
- Elija el modo de sincronización adecuado: use sincronización desencadenada en lugar de sincronización continua siempre que sea posible, para reducir los costos de streaming.
- Identificar y eliminar puntos de conexión vacíos: consulte Identificación y eliminación de puntos de conexión de búsqueda de vectores vacíos.
Recursos adicionales
- Precios de Mosaic AI Vector Search
- Paneles de uso e instrucciones
- Póngase en contacto con el equipo de la cuenta de Databricks si desea obtener instrucciones adicionales sobre cómo predecir el uso o aprovechar las herramientas de estimación de costos específicas de las cargas de trabajo.