Partager via


Ajouter une ressource de point de terminaison de modèle à une application Databricks

Ajoutez des points de terminaison pour le service des modèles en tant que ressources Databricks Apps afin que votre application puisse interroger des modèles d'apprentissage automatique pour l'inférence. Les points de terminaison de service de modèle gèrent les prédictions de modèle et fournissent une interface cohérente pour accéder aux modèles déployés.

Ajouter une ressource de point de terminaison de service de modèle

Avant d’ajouter un modèle servant de point de terminaison en tant que ressource, passez en revue les prérequis des ressources d’application.

  1. Lorsque vous créez ou modifiez une application, accédez à l’étape Configurer .
  2. Dans la section Ressources de l’application , cliquez sur + Ajouter une ressource.
  3. Sélectionnez Service de point de terminaison comme type de ressource.
  4. Choisissez un modèle servant un point de terminaison à partir des points de terminaison disponibles dans votre espace de travail.
  5. Sélectionnez le niveau d’autorisation approprié pour votre application :
    • Peut afficher : Affichez les métadonnées de point de terminaison, notamment les noms de modèle, les versions et la configuration de la charge de travail. Impossible d’envoyer des demandes d’inférence.
    • Peut interroger : Envoyez des demandes d’inférence et affichez les métadonnées. Utilisez cette option pour la plupart des applications qui ont besoin de prédictions de modèle.
    • Peut gérer : Contrôle administratif complet, notamment l’affichage, la modification, la requête, la suppression et la gestion des autorisations.
  6. (Facultatif) Spécifiez une clé de ressource personnalisée, c’est-à-dire la façon dont vous référencez le point de terminaison de service du modèle dans la configuration de votre application. La clé par défaut est serving-endpoint.

Note

Le point de terminaison de service du modèle doit être dans un READY état pour traiter les demandes d’inférence de votre application.

Variables d’environnement

Lorsque vous déployez une application avec une ressource de point de terminaison de service de modèle, Azure Databricks expose le nom du point de terminaison de service via des variables d’environnement que vous pouvez référencer à l’aide du valueFrom champ.

Par exemple:

SERVING_ENDPOINT=<your-serving-endpoint-name>

Pour plus d’informations, consultez Utiliser des variables d’environnement pour accéder aux ressources.

Supprimer une ressource de serveur de modèle

Lorsque vous supprimez un modèle servant la ressource de point de terminaison d’une application, le principal de service de l’application perd l’accès au point de terminaison. Le modèle servant le point de terminaison lui-même reste inchangé et continue d’être disponible pour d’autres utilisateurs et applications disposant d’autorisations appropriées.

Meilleures pratiques

Tenez compte des points de terminaison suivants lorsque vous travaillez avec le modèle servant des ressources de point de terminaison :

  • Accordez des autorisations minimales. Utilisez Can view pour le moins d’accès ou Can query pour la plupart des applications qui doivent envoyer des demandes d’inférence, sauf si votre application a spécifiquement besoin d’effectuer des tâches administratives sur le point de terminaison.
  • Évitez les requêtes longues lorsque cela est possible, car les demandes d’inférence peuvent expirer.
  • Vérifiez l’état du point de terminaison avant d’envoyer des demandes. Les terminaux doivent être à l'état READY pour traiter les requêtes.
  • Envisagez de limiter vos demandes d’inférence pour éviter d'accabler le point de terminaison, surtout pendant les périodes de trafic élevé.