Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article explique comment gérer efficacement vos coûts lors de l'utilisation de la recherche vectorielle Mosaic AI. Elle couvre les rubriques suivantes :
- Principes de base de l’index de recherche vectorielle et du point de terminaison.
- Surveillance de la facturation et de l’utilisation.
- Modes de synchronisation.
- Meilleures pratiques pour optimiser les coûts.
Pour identifier et supprimer des points de terminaison vides, consultez Identifier et supprimer des points de terminaison recherche vectorielle vides.
Notions de base de la recherche vectorielle d’IA de Mosaïque
La recherche vectorielle de Mosaic AI est composée de :
- Index de recherche vectorielle : les index stockent vos vecteurs pour la recherche et la récupération.
- Points de terminaison de recherche vectorielles : chaque point de terminaison héberge un ou plusieurs index pour traiter les requêtes. Vous pouvez avoir plusieurs index servis sous un seul point de terminaison et un point de terminaison peut servir jusqu’à 50 index. Dans de nombreux cas, vous pouvez combiner des charges de travail plus petites sur un point de terminaison unique pour réduire les coûts totaux.
Comment la recherche vectorielle est facturée
Databricks offre deux options de point de terminaison :
Points de terminaison standard. Une unité de recherche vectorielle couvre jusqu’à 2 millions de vecteurs de dimension 768 (ou l’équivalent). Par exemple, si vous avez 1 million de vecteurs de dimension 1536, qui comptent également comme une unité.
Points de terminaison optimisés pour le stockage. Une unité de recherche vectorielle couvre jusqu’à 64 millions de vecteurs de dimension 768 (ou l’équivalent).
Pour les deux options, chaque point de terminaison a un prix de base et s’adapte automatiquement à la taille totale des indices qu’il sert.
- Les points de terminaison standard ne se réduisent pas automatiquement en échelle. Même si vous supprimez des vecteurs ou réduisez la taille de vos index, vous continuez à payer pour la capacité supérieure jusqu’à ce que vous apportez des modifications manuellement.
- Les points de terminaison optimisés pour le stockage sont réduits automatiquement lorsqu’un index est supprimé. La taille minimale d’un point de terminaison est une unité de recherche vectorielle.
Important
Les points de terminaison standard ne se réduisent pas automatiquement en échelle. Si votre nombre de vecteurs diminue considérablement (par exemple, de 4 millions à 1,5 million de vecteurs), vous continuez à payer pour la capacité supérieure (deux unités de recherche vectorielles dans cet exemple) jusqu’à ce que vous supprimiez le point de terminaison et en créez un nouveau. Cela est vrai uniquement pour les points de terminaison standard. Les points de terminaison optimisés pour le stockage sont réduits automatiquement.
Comment surveiller l’utilisation et les coûts
Databricks fournit une table d’utilisation facturable, des tableaux de bord d’utilisation et des stratégies budgétaires pour vous aider à surveiller l’utilisation et les coûts de recherche vectorielle.
Table d’utilisation facturable
Voici un exemple de requête de la table d’utilisation facturable :
WITH all_vector_search_usage AS (
SELECT *,
CASE WHEN usage_metadata.endpoint_name IS NULL THEN 'ingest'
WHEN usage_type = "STORAGE_SPACE" THEN 'storage'
ELSE 'serving'
END as workload_type
FROM system.billing.usage
WHERE billing_origin_product = 'VECTOR_SEARCH'
),
daily_dbus AS (
SELECT
workspace_id,
cloud,
usage_date,
workload_type,
usage_metadata.endpoint_name as vector_search_endpoint,
CASE WHEN workload_type = 'serving' THEN SUM(usage_quantity)
WHEN workload_type = 'ingest' THEN SUM(usage_quantity)
ELSE null
END as dbus,
CASE WHEN workload_type = 'storage' THEN SUM(usage_quantity)
ELSE null
END as dsus
FROM all_vector_search_usage
GROUP BY 1,2,3,4,5
ORDER BY 1,2,3,4,5 DESC
)
SELECT * FROM daily_dbus;
Pour plus d’informations sur la table d’utilisation facturable, consultez Référence de la table système d’utilisation facturable.
Des requêtes supplémentaires se trouvent dans l’exemple de notebook suivant.
Notebook de requêtes de tables système de recherche vectorielle
Obtenir un ordinateur portable
Tableaux de bord d’utilisation
Pour plus d’informations sur les tableaux de bord d’utilisation que vous pouvez importer pour obtenir des insights sur les pilotes de coûts, notamment l’utilisation pour la recherche vectorielle, consultez Tableaux de bord Utilisation.
Stratégies budgétaires
Les stratégies budgétaires permettent aux administrateurs de regrouper et de filtrer les enregistrements de facturation sur tous les produits serverless Azure Databricks et de fournir une interface utilisateur dédiée pour le suivi des dépenses. Pour savoir comment appliquer une stratégie budgétaire à un point de terminaison de recherche vectorielle, consultez La recherche vectorielle d’IA de Mosaïque : Stratégies budgétaires. Pour obtenir des informations générales et des détails sur la création et la gestion des politiques budgétaires, consultez l’utilisation des attributs avec des politiques budgétaires sans serveur.
Comment gérer les coûts de synchronisation d’index
Vous pouvez configurer votre index pour le mettre à jour de deux manières :
- Synchronisation déclenchée : vous appelez l’API ou le Kit de développement logiciel (SDK) Python pour déclencher une mise à jour d’index. Il s’agit de l’option la plus rentable.
- Synchronisation continue : l’index est automatiquement mis à jour avec des modifications de la table Delta source avec une latence quasi en temps réel. Cela coûte plus cher, car un cluster de diffusion en continu est approvisionné pour gérer la synchronisation. Si les mises à jour en quasi temps réel avec des secondes de latence ne sont pas critiques, envisagez d’utiliser La synchronisation déclenchée pour réduire les coûts.
Meilleures pratiques pour la gestion des coûts
- Combiner des charges de travail sur un point de terminaison unique : si vous prévoyez un faible QPS sur tous les indices, vous pouvez combiner vos index sous un seul point de terminaison pour éviter plusieurs coûts de point de terminaison de base. Pour plus d’informations, consultez le guide des performances de recherche vectorielle .
- Surveiller l’utilisation : utilisez les tables de facturation système et les tableaux de bord d’utilisation intégrés pour suivre la capacité, l’utilisation et les coûts.
- Pour les points de terminaison standard, effectuez un scale-down manuellement : comme expliqué ci-dessus, pour les points de terminaison standard, vous devez supprimer le point de terminaison et le recréer si votre nombre de vecteurs tombe en dessous d’un seuil de capacité précédent dont vous n’avez plus besoin. Les points de terminaison optimisés pour le stockage sont réduits automatiquement lorsqu’un index est supprimé.
- Choisissez le mode de synchronisation approprié : utilisez la synchronisation déclenchée au lieu de la synchronisation continue si possible, pour réduire les coûts de diffusion en continu.
- Identifier et supprimer des points de terminaison vides : consultez Identifier et supprimer des points de terminaison de recherche vectorielle vides.
Ressources additionnelles
- Tarification de la recherche vectorielle Mosaic AI
- Tableaux de bord d’utilisation et instructions
- Contactez votre équipe de compte Databricks si vous souhaitez obtenir des conseils supplémentaires sur la prévision de votre utilisation ou sur l’utilisation des outils d’estimation des coûts spécifiques à vos charges de travail.