Explorer et utiliser des environnements organisés

Effectué

Les environnements organisés sont des environnements prédéfinis pour les charges de travail Machine Learning les plus courantes, disponibles dans votre espace de travail par défaut.

Les environnements organisés utilisent le préfixe AzureML et sont conçus pour fournir des scripts qui utilisent des infrastructures et des outils machine learning populaires.

Par exemple, il existe des environnements organisés pour lesquelles vous souhaitez exécuter un script qui entraîne une régression, un clustering ou un modèle de classification avec Scikit-Learn.

Pour explorer un environnement organisé, vous pouvez l’afficher dans le studio, à l’aide d’Azure CLI ou du Kit de développement logiciel (SDK) Python.

La commande suivante vous permet de récupérer la description et les balises d’un environnement organisé avec le Kit de développement logiciel (SDK) Python :

env = ml_client.environments.get("AzureML-sklearn-0.24-ubuntu18.04-py37-cpu", version=44)
print(env. description, env.tags)

Utiliser un environnement organisé

Le plus souvent, vous utilisez des environnements lorsque vous souhaitez exécuter un script en tant que commandetâche.

Pour spécifier l’environnement que vous souhaitez utiliser pour exécuter votre script, vous référencez un environnement par son nom et sa version.

Par exemple, le code suivant montre comment configurer un travail de commande avec le Kit de développement logiciel (SDK) Python, qui utilise un environnement organisé, notamment Scikit-Learn :

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    display_name="train-with-curated-environment",
    experiment_name="train-with-curated-environment"
)

# submit job
returned_job = ml_client.create_or_update(job)

Tester et dépanner un environnement sélectionné

Comme les environnements organisés permettent un temps de déploiement plus rapide, il est recommandé d’explorer d’abord si l’un des environnements organisés précréés peut être utilisé pour exécuter votre code.

Vous pouvez vérifier qu’un environnement organisé inclut tous les packages nécessaires en consultant ses détails. Ensuite, vous pouvez tester à l’aide de l’environnement pour exécuter le script.

Si un environnement n’inclut pas tous les packages nécessaires pour exécuter votre code, votre travail échoue.

En cas d’échec d’un travail, vous pouvez consulter les journaux d’erreurs détaillés sous l’onglet Sorties + journaux de votre travail dans Azure Machine Learning Studio.

Un message d’erreur courant indiquant que votre environnement est incomplet, est ModuleNotFoundError. Le module introuvable est répertorié dans le message d’erreur. En examinant le message d’erreur, vous pouvez mettre à jour l’environnement pour inclure les bibliothèques pour vous assurer que les packages nécessaires sont installés sur la cible de calcul avant d’exécuter le code.

Lorsque vous devez spécifier d’autres packages nécessaires, vous pouvez utiliser un environnement organisé comme référence pour vos propres environnements personnalisés en modifiant les fichiers Dockerfiles qui sauvegardent ces environnements organisés.