Partager via


Déployer l’extension pour edge RAG Preview activée par Azure Arc

Une fois les étapes préalables terminées, suivez les étapes décrites dans cet article pour déployer l’extension EDGE RAG.

Pour essayer Edge RAG sans avoir besoin de matériel local, consultez Démarrage rapide : Installer edge RAG Preview activé par Azure Arc.

Important

Edge RAG Preview activé par Azure Arc est actuellement en PRÉVERSION. Consultez les Conditions d’utilisation supplémentaires pour les préversions Microsoft Azure pour les conditions légales qui s’appliquent aux fonctionnalités Azure en version bêta, en préversion ou qui ne sont pas encore publiées en disponibilité générale.

Conditions préalables

Avant de commencer, suivez les prérequis de déploiement pour Edge RAG Preview.

Déployer l’extension

Déployez Edge RAG à l’aide du portail Azure ou d’Azure CLI avec un modèle de langage fourni par Edge RAG ou utilisez votre propre modèle de langage.

  1. Dans le portail Azure, accédez au cluster Azure Kubernetes sur Azure Local.

  2. Sélectionnez Paramètres>Extensions>+ Ajouter, et Edge RAG dans la liste.

    Capture d’écran des extensions que vous pouvez ajouter à partir du cluster avec Edge RAG mis en surbrillance.

  3. Sous l’onglet Informations de base , fournissez les informations suivantes :

    Champ Valeur
    Abonnement Sélectionnez l’abonnement qui contient votre cluster Azure Kubernetes Service (AKS) sur Azure Local.
    groupe de ressources Sélectionnez le groupe de ressources qui contient votre cluster AKS Arc.
    Nom du déploiement Indiquez un nom pour le déploiement.
    Région Sélectionnez la région pour déployer Edge RAG.
    Groupe Sélectionnez le cluster sur lequel vous souhaitez déployer Edge RAG.

    Capture d’écran de l’onglet de base avec des champs pour entrer les détails du projet et de l’instance.

  4. Sélectionnez Suivant : Configuration.

  5. Sous l’onglet Configuration, fournissez les informations suivantes :

    Champ Valeur
    Mode de déploiement Sélectionnez le mode GPU ou le mode PROCESSEUR en fonction de votre matériel disponible.
    Modèle Les informations que vous entrez dans cette section dépendent du modèle de langue que vous sélectionnez.
    Source du modèle de langage Sélectionnez le modèle de langage que vous souhaitez déployer. Choisissez un modèle de langage fourni par EDGE RAG ou apportez un propre modèle de langage (BYOM).
    Nom du modèle de langage Si vous avez choisi d’utiliser un modèle fourni, sélectionnez l’un des modèles de langage fournis par Edge RAG.
    Ajouter votre propre modèle de langage Si vous avez choisi d’apporter votre propre modèle de langage, entrez les informations suivantes.
    Nom du modèle Entrez le nom de votre modèle de langue.
    Point de terminaison LLM Entrez le nom de votre point de terminaison LLM (Large Language Model) au format http://some-endpoint ou https://some-endpoint. Par exemple : https://<Endpoint_Name>.openai.azure.com/openai/deployments/<model_name> /chat/completions?api-version=<API_VERSION>.
    Nombre maximal de jetons (k) Entrez une plage de nombres comprise entre 4 000 et 2048 K pour votre modèle de langage.
    Paramètres SSL
    CNAME SSL Indiquez le nom de domaine de votre système. Ce nom de domaine est identique à l’URI de redirection fourni lors de l’inscription de l’application.
    Nom du secret SSL Kubernetes Fournissez un nom convivial pour que le secret SSL soit utilisé par l’application. Par défaut, Edge RAG utilise un certificat SSL auto-signé pour le stocker sous ce nom dans le Magasin de Secrets Kubernetes. Après l’installation, vous pouvez mettre à jour le certificat avec un certificat signé officiel.
    Accès
    ID d’application Entra Fournissez l’ID d’application de l’application que vous avez inscrite dans le cadre de la configuration de l’authentification (App Registrations > Your app > Overview).
    ID de locataire Entra Fournissez l’ID de locataire de l’application que vous avez enregistrée dans le cadre de la configuration de l’authentification (App Registrations > Your app > Overview).

    Capture d’écran de l’onglet Configuration dans lequel vous sélectionnez le type de modèle et d’autres configurations.

  6. Sélectionnez Vérifier + créer.

  7. Passez en revue et validez les paramètres que vous avez fournis.

  8. Sélectionnez Créer pour terminer le déploiement edge RAG.

  9. Une fois le déploiement terminé, sous Extensions, vérifiez que les types d’extensions microsoft.arc.rag et microsoft.extensiondiagnostics sont répertoriés .

Le déploiement d’extension EDGE RAG prend généralement environ 30 minutes, mais peut prendre plus de temps en fonction de votre connectivité.

Apportez votre propre modèle de langage

Si vous avez ajouté votre propre modèle de langage lorsque vous avez déployé l’extension EDGE RAG, suivez les étapes décrites dans Configurer l’authentification de point de terminaison « BYOM » pour Edge RAG.