Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Important
Ce vectoriseur est en préversion publique sous conditions d’utilisation supplémentaires. Pour utiliser cette fonctionnalité, nous vous recommandons la dernière préversion des index - Créer ou mettre à jour (API REST).
Le vectoriseur de catalogue de modèles Microsoft Foundry se connecte à un modèle incorporé déployé à partir du catalogue de modèles Foundry ou d’un point de terminaison Azure Machine Learning (AML). Vos données sont traitées dans l’emplacement géographique où votre modèle est déployé.
Si vous utilisez la vectorisation intégrée pour créer les tableaux vectoriels, l’ensemble de compétences doit inclure une compétence AML qui pointe vers le même modèle spécifié dans le vectoriseur.
Prerequisites
Un projet hub Microsoft Foundry ou un espace de travail AML pour un modèle personnalisé que vous créez.
Pour les projets basés sur hub uniquement, un déploiement serverless d’un modèle pris en charge à partir du catalogue de modèles Microsoft Foundry. Vous pouvez utiliser un modèle ARM/Bicep pour approvisionner le déploiement serverless.
Paramètres vectoriseurs
Les paramètres respectent la casse. Les paramètres que vous utilisez dépendent de l’authentification dont votre fournisseur de modèle a besoin, le cas échéant.
| Nom du paramètre | Description |
|---|---|
uri |
(Obligatoire pour l’authentification par clé) URI cible du déploiement serverless à partir du catalogue de modèles Microsoft Foundry ou de l’URI de scoring du point de terminaison en ligne AML. Seul le schéma d’URI HTTPS est autorisé. |
key |
(Obligatoire pour l’authentification par clé) Clé API du fournisseur de modèles. |
resourceId |
(Obligatoire pour l’authentification par jeton) ID de ressource Azure Resource Manager du fournisseur de modèles. Pour un point de terminaison en ligne AML, utilisez le subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name} format. |
modelName |
Nom du modèle d’incorporation à partir du catalogue de modèles Microsoft Foundry déployé à l’adresse spécifiée uri. Les modèles pris en charge (déploiements serverless uniquement) sont les suivants :
|
region |
(Facultatif pour l’authentification par jeton) Région dans laquelle le fournisseur de modèles est déployé. Obligatoire si la région est différente de la région du service de recherche. |
timeout |
(Facultatif) Délai d’expiration du client HTTP effectuant l’appel d’API. Il doit être formaté en tant que valeur « dayTimeDuration » XSD (un sous-ensemble limité d'une valeur de durée ISO 8601 ). Par exemple, PT60S pour 60 secondes. S’il n’est pas défini, une valeur par défaut de 30 secondes est choisie. Le délai d’expiration peut être défini sur 230 secondes maximum et 1 seconde minimum. |
Quels paramètres d’authentification utiliser
Le vectoriseur de catalogue de modèles Microsoft Foundry fournit deux options d’authentification :
Authentification basée sur des clés. Vous fournissez une clé statique pour authentifier les demandes de scoring à partir du vectoriseur. Définissez les paramètres et
urileskeyparamètres de cette connexion.Authentification basée sur les jetons. Le projet hub Foundry ou le point de terminaison en ligne AML est déployé à l’aide de l’authentification basée sur les jetons. Le service Recherche d’IA Azure doit avoir une identité managée et une attribution de rôle sur le fournisseur de modèles. Le vectoriseur utilise ensuite l’identité du service de recherche pour s’authentifier auprès du fournisseur de modèles, sans clés statiques requises. L’identité du service de recherche doit avoir le rôle Propriétaire ou Contributeur . Définissez le
resourceIdparamètre et, si le service de recherche se trouve dans une autre région que le fournisseur de modèles, définissez leregionparamètre.
Types de requêtes vectorielles pris en charge
Les types de requêtes vectorielles pris en charge par le vectoriseur de catalogue de modèles Microsoft Foundry dépendent de l’élément modelName configuré.
| Modèle d’incorporation | Prend en charge la requête text |
Prend en charge la requête imageUrl |
Prend en charge la requête imageBinary |
|---|---|---|---|
| Cohere-embed-v3-english | X | X | |
| Cohere-embed-v3-multilingual | X | X | |
| Cohere-embed-v4 | X | X |
Dimensions attendues du champ
Les dimensions de champ attendues pour un champ vectoriel configuré avec un vectoriseur de catalogue de modèles Microsoft Foundry dépendent de l’élément modelName configuré.
modelName |
Dimensions attendues |
|---|---|
| Cohere-embed-v3-english | 1024 |
| Cohere-embed-v3-multilingual | 1024 |
| Cohere-embed-v4 | 256–1536 |
Exemple de définition
Les noms de modèles suggérés dans le catalogue de modèles Foundry se composent du modèle de base et d’un suffixe à trois lettres aléatoires. Le nom de votre modèle sera différent de celui indiqué dans cet exemple.
"vectorizers": [
{
"name": "my-model-catalog-vectorizer",
"kind": "aml",
"amlParameters": {
"uri": "https://Cohere-embed-v3-multilingual-hin.eastus.models.ai.azure.com",
"key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
"timeout": "PT60S",
"modelName": "Cohere-embed-v3-multilingual-hin",
"resourceId": null,
"region": null,
},
}
]