Partager via


Vectoriseur du catalogue de modèles Microsoft Foundry

Important

Ce vectoriseur est en préversion publique sous conditions d’utilisation supplémentaires. Pour utiliser cette fonctionnalité, nous vous recommandons la dernière préversion des index - Créer ou mettre à jour (API REST).

Le vectoriseur de catalogue de modèles Microsoft Foundry se connecte à un modèle incorporé déployé à partir du catalogue de modèles Foundry ou d’un point de terminaison Azure Machine Learning (AML). Vos données sont traitées dans l’emplacement géographique où votre modèle est déployé.

Si vous utilisez la vectorisation intégrée pour créer les tableaux vectoriels, l’ensemble de compétences doit inclure une compétence AML qui pointe vers le même modèle spécifié dans le vectoriseur.

Prerequisites

Paramètres vectoriseurs

Les paramètres respectent la casse. Les paramètres que vous utilisez dépendent de l’authentification dont votre fournisseur de modèle a besoin, le cas échéant.

Nom du paramètre Description
uri (Obligatoire pour l’authentification par clé) URI cible du déploiement serverless à partir du catalogue de modèles Microsoft Foundry ou de l’URI de scoring du point de terminaison en ligne AML. Seul le schéma d’URI HTTPS est autorisé.
key (Obligatoire pour l’authentification par clé) Clé API du fournisseur de modèles.
resourceId (Obligatoire pour l’authentification par jeton) ID de ressource Azure Resource Manager du fournisseur de modèles. Pour un point de terminaison en ligne AML, utilisez le subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name} format.
modelName Nom du modèle d’incorporation à partir du catalogue de modèles Microsoft Foundry déployé à l’adresse spécifiée uri. Les modèles pris en charge (déploiements serverless uniquement) sont les suivants :

  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
  • Cohere-embed-v4
region (Facultatif pour l’authentification par jeton) Région dans laquelle le fournisseur de modèles est déployé. Obligatoire si la région est différente de la région du service de recherche.
timeout (Facultatif) Délai d’expiration du client HTTP effectuant l’appel d’API. Il doit être formaté en tant que valeur « dayTimeDuration » XSD (un sous-ensemble limité d'une valeur de durée ISO 8601 ). Par exemple, PT60S pour 60 secondes. S’il n’est pas défini, une valeur par défaut de 30 secondes est choisie. Le délai d’expiration peut être défini sur 230 secondes maximum et 1 seconde minimum.

Quels paramètres d’authentification utiliser

Le vectoriseur de catalogue de modèles Microsoft Foundry fournit deux options d’authentification :

  • Authentification basée sur des clés. Vous fournissez une clé statique pour authentifier les demandes de scoring à partir du vectoriseur. Définissez les paramètres et uri les key paramètres de cette connexion.

  • Authentification basée sur les jetons. Le projet hub Foundry ou le point de terminaison en ligne AML est déployé à l’aide de l’authentification basée sur les jetons. Le service Recherche d’IA Azure doit avoir une identité managée et une attribution de rôle sur le fournisseur de modèles. Le vectoriseur utilise ensuite l’identité du service de recherche pour s’authentifier auprès du fournisseur de modèles, sans clés statiques requises. L’identité du service de recherche doit avoir le rôle Propriétaire ou Contributeur . Définissez le resourceId paramètre et, si le service de recherche se trouve dans une autre région que le fournisseur de modèles, définissez le region paramètre.

Types de requêtes vectorielles pris en charge

Les types de requêtes vectorielles pris en charge par le vectoriseur de catalogue de modèles Microsoft Foundry dépendent de l’élément modelName configuré.

Modèle d’incorporation Prend en charge la requête text Prend en charge la requête imageUrl Prend en charge la requête imageBinary
Cohere-embed-v3-english X X
Cohere-embed-v3-multilingual X X
Cohere-embed-v4 X X

Dimensions attendues du champ

Les dimensions de champ attendues pour un champ vectoriel configuré avec un vectoriseur de catalogue de modèles Microsoft Foundry dépendent de l’élément modelName configuré.

modelName Dimensions attendues
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024
Cohere-embed-v4 256–1536

Exemple de définition

Les noms de modèles suggérés dans le catalogue de modèles Foundry se composent du modèle de base et d’un suffixe à trois lettres aléatoires. Le nom de votre modèle sera différent de celui indiqué dans cet exemple.

"vectorizers": [
    {
        "name": "my-model-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://Cohere-embed-v3-multilingual-hin.eastus.models.ai.azure.com",
            "key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
            "timeout": "PT60S",
            "modelName": "Cohere-embed-v3-multilingual-hin",
            "resourceId": null,
            "region": null,
        },
    }
]

Voir aussi