Partager via


Consommer des API serverless à partir d’un autre projet ou hub Microsoft Foundry

Note

Ce document fait référence au portail Microsoft Foundry (classique).

🔍 Consultez la documentation Microsoft Foundry (nouvelle) pour en savoir plus sur le nouveau portail.

Dans cet article, vous allez apprendre à configurer une API serverless existante dans un autre projet ou hub que celui utilisé pour créer le déploiement.

Important

Les modèles en préversion comportent la mention préversion sur leur carte de modèle dans le catalogue de modèles.

Certains modèles du catalogue de modèles peuvent être déployés en tant qu’API serverless. Ce type de déploiement permet de consommer des modèles en tant qu’API sans les héberger sur votre abonnement, tout en conservant la sécurité et la conformité de l’entreprise dont les organisations ont besoin. Cette option de déploiement ne nécessite pas de quota à partir de votre abonnement.

La nécessité d’utiliser un point de terminaison d’API serverless dans un autre projet ou hub que celui utilisé pour créer le déploiement peut survenir dans des situations telles que celles-ci :

  • Vous souhaitez centraliser vos déploiements dans un projet ou hub donné et les consommer à partir de différents projets ou hubs de votre organisation.
  • Vous devez déployer un modèle dans un hub dans une région Azure particulière où le déploiement serverless pour ce modèle est disponible. Toutefois, vous devez l’utiliser à partir d’une autre région, où le déploiement serverless n’est pas disponible pour les modèles particuliers.

Conditions préalables

Créer une connexion de point de terminaison d’API sans serveur

Pour créer une connexion, effectuez les étapes suivantes :

  1. Connectez-vous au projet ou au hub où le point de terminaison est déployé :

    Conseil / Astuce

    Étant donné que vous pouvez personnaliser le volet gauche dans le portail Microsoft Foundry, vous pouvez voir différents éléments que ceux indiqués dans ces étapes. Si vous ne voyez pas ce que vous recherchez, sélectionnez ... Plus en bas du volet gauche.

    Accédez à Foundry et accédez au projet dans lequel le point de terminaison auquel vous souhaitez vous connecter est déployé.

  2. Obtenez l’URL et les informations d’identification du point de terminaison pour le point de terminaison auquel vous souhaitez vous connecter. Dans cet exemple, vous obtenez les détails d’un nom de point de terminaison meta-llama3-8b-qwerty.

    1. Dans la barre latérale gauche de votre projet dans le portail Foundry, accédez à Mes ressources>Modèles + points de terminaison pour afficher la liste des déploiements dans le projet.

    2. Sélectionnez le déploiement auquel vous souhaitez vous connecter.

    3. Copiez les valeurs pour l’URI cible et la clé.

  3. À présent, connectez-vous au projet ou au hub où vous souhaitez créer la connexion :

    Accédez au projet dans lequel la connexion doit être créée.

  4. Créer la connexion dans le projet :

    1. Dans le portail Foundry, accédez à la partie inférieure de la barre latérale gauche et sélectionnez Centre de gestion.

    2. Dans la barre latérale gauche du centre de gestion, sélectionnez Ressources connectées.

    3. Sélectionnez Nouvelle connexion.

    4. Sélectionnez Modèle serverless.

    5. Pour l’URI cible, collez la valeur que vous avez copiée précédemment.

    6. Pour laclé, collez la valeur que vous avez copiée précédemment.

    7. Donnez un nom à la connexion, dans ce cas meta-llama3-8b-connection.

    8. Sélectionnez Ajouter une connexion.

  5. À ce stade, la connexion est disponible pour la consommation.

  6. Pour vérifier que la connexion fonctionne :

    1. Revenez à votre projet dans le portail Foundry.

    2. Dans la barre latérale gauche de votre projet, accédez à Générer et personnaliser>Flux d’invite.

    3. Sélectionnez Créer pour créer un nouveau flux.

    4. Sélectionnez Créer dans la zone flux de conversation.

    5. Donnez un nom à votre Flux d’invite, puis sélectionnez Créer.

    6. Sélectionnez le nœud de conversation dans le graphique pour accéder à la section conversation.

    7. Pour Connexion, ouvrez la liste déroulante pour sélectionner la connexion que vous venez de créer, dans ce cas meta-llama3-8b-connection.

    8. Sélectionnez Démarrer la session de calcul dans la barre de navigation supérieure pour démarrer une exécution automatique de flux de requêtes.

    9. Sélectionnez l’option conversation. Vous pouvez maintenant envoyer des messages et recevoir des réponses.