Partager via


Effectuer l’apprentissage des modèles avec Azure Machine Learning (v1)

S’APPLIQUE À :Kit de développement logiciel (SDK) Azure Machine Learning v1 pour Python

Important

Cet article fournit des informations sur l’utilisation du Kit de développement logiciel (SDK) Azure Machine Learning v1. Sdk v1 est déconseillé depuis le 31 mars 2025. La prise en charge prendra fin le 30 juin 2026. Vous pouvez installer et utiliser le Kit de développement logiciel (SDK) v1 jusqu’à cette date. Vos flux de travail existants utilisant le Kit de développement logiciel (SDK) v1 continueront à fonctionner après la date de fin de support. Toutefois, elles peuvent être exposées à des risques de sécurité ou à des modifications disruptives en cas de changements architecturaux du produit.

Nous vous recommandons de passer au SDK v2 avant le 30 juin 2026. Pour plus d’informations sur le SDK v2, consultez Qu’est-ce qu’Azure Machine Learning CLI et le SDK Python v2 ? et la référence du SDK v2.

Azure Machine Learning offre plusieurs façons d’entraîner des modèles, notamment des solutions code-first avec le SDK et des options de faible code telles que le Machine Learning automatisé et le concepteur visuel. Utilisez la liste suivante pour déterminer quelle méthode d’entraînement répond à vos besoins :

  • Kit de développement logiciel (SDK) Azure Machine Learning pour Python : le SDK Python permet d’entraîner les modèles de plusieurs façons, chacune dotée de fonctionnalités différentes.

    Méthode d’apprentissage Descriptif
    Configuration d’exécution Un moyen courant d’entraîner des modèles consiste à utiliser un script d’entraînement et une configuration de travail. La configuration du travail définit l’environnement d’entraînement, y compris votre script, votre cible de calcul et votre environnement Azure Machine Learning. Vous pouvez exécuter un travail de formation en spécifiant ces détails.
    ML automatisé Le Machine Learning automatisé vous permet d’entraîner des modèles sans expertise approfondie en science des données ou en programmation. Pour les utilisateurs expérimentés, il permet de gagner du temps en automatisant la sélection d’algorithmes et le réglage des hyperparamètres. La configuration du travail n’est pas nécessaire lors de l’utilisation du Machine Learning automatisé.
    Pipeline de Machine Learning Les pipelines ne sont pas une méthode d’entraînement distincte, mais un moyen de définir des flux de travail à l’aide d’étapes modulaires et réutilisables qui peuvent inclure l’entraînement. Les pipelines prennent en charge le Machine Learning automatisé et exécutent la configuration. Utilisez un pipeline lorsque vous souhaitez :
    * Planifiez des processus sans assistance , tels que des travaux d’apprentissage de longue durée ou la préparation des données.
    * Coordonnez plusieurs étapes entre différentes ressources de calcul et emplacements de stockage.
    * Créez un modèle réutilisable pour des scénarios tels que la réentraînation ou le scoring par lots.
    * Suivi et contrôle de version des sources de données, entrées et sorties pour votre workflow.
    * Permettre à différentes équipes de travailler sur des étapes spécifiques indépendamment et de les combiner dans un pipeline.
  • Concepteur : le concepteur Azure Machine Learning est un point d’entrée facile pour créer une preuve de concepts ou pour les utilisateurs disposant d’une expérience de codage limitée. Entraîner des modèles à l’aide d’une interface utilisateur Web avec fonction de glisser-déposer. Vous pouvez inclure du code Python ou entraîner des modèles sans écrire de code.

  • Azure CLI : l’interface CLI Machine Learning offre des commandes pour les tâches Azure Machine Learning courantes et est souvent utilisée pour l’écriture de scripts et l’automatisation. Par exemple, après avoir créé un script ou un pipeline d’entraînement, vous pouvez utiliser l’interface CLI pour démarrer un travail d’entraînement selon une planification ou lorsque des données d’apprentissage sont mises à jour. L’interface CLI peut envoyer des travaux à l’aide de configurations d’exécution ou de pipelines.

Chaque méthode d’entraînement peut utiliser différents types de ressources de calcul, appelées cibles de calcul. Une cible de calcul peut être une machine locale ou une ressource cloud, telle qu’Azure Machine Learning Compute, Azure HDInsight ou une machine virtuelle distante.

Kit de développement logiciel (SDK) Python

Le Kit de développement logiciel (SDK) Azure Machine Learning pour Python vous permet de créer et d’exécuter des flux de travail Machine Learning. Vous pouvez interagir avec le service à partir d’une session Python interactive, de Jupyter Notebooks, de Visual Studio Code ou d’un autre environnement de développement intégré.

Configuration d’exécution

Un travail d’apprentissage classique dans Azure Machine Learning est défini à l’aide de ScriptRunConfig. La configuration de l’exécution du script, ainsi que vos scripts d’entraînement, est utilisée pour entraîner un modèle sur une cible de calcul.

Vous pouvez commencer par une configuration d’exécution pour votre ordinateur local et basculer vers une cible de calcul basée sur le cloud en fonction des besoins. Pour modifier la cible de calcul, mettez à jour la configuration d’exécution. Chaque exécution enregistre des informations sur le travail d’apprentissage, notamment les entrées, les sorties et les journaux.

Machine Learning automatisé

Définissez les itérations, les paramètres d'hyperparamètres, la featurisation et d’autres options. Pendant l’entraînement, Azure Machine Learning teste différents algorithmes et paramètres en parallèle. L’entraînement s’arrête lorsqu’il répond aux critères de sortie que vous avez définis.

Conseil

Vous pouvez également utiliser le ML automatisé via Azure Machine Learning Studio, en plus du Kit de développement logiciel (SDK) Python.

Pipeline de Machine Learning

Les pipelines Machine Learning peuvent utiliser les méthodes d’entraînement décrites ci-dessus. Les pipelines se concentrent sur la création de flux de travail et couvrent plus que l’entraînement de modèles. Dans un pipeline, vous pouvez entraîner un modèle en utilisant le ML automatisé ou des configurations d’exécution.

Fonctionnement d’une tâche d’apprentissage

Le cycle de vie de formation Azure comprend les éléments suivants :

  1. Compression des fichiers dans votre dossier de projet, en ignorant ceux spécifiés dans .amlignore ou .gitignore
  2. Mise à l’échelle de votre cluster de calcul
  3. Génération ou téléchargement de l’image Docker sur le nœud de calcul
    1. Le système calcule un code de hachage pour :
    2. Le système utilise ce hachage pour rechercher l’espace de travail dans Azure Container Registry (ACR).
    3. S’il est introuvable, il vérifie l’ACR global
    4. S’il n’est toujours pas trouvé, le système génère une nouvelle image (mise en cache et inscrite auprès de l’espace de travail ACR)
  4. Téléchargement de votre Fichier projet compressé vers le stockage temporaire sur le nœud de calcul
  5. Décompression du Fichier projet
  6. Le nœud de calcul s’exécute python <entry script> <arguments>
  7. Enregistrement des journaux, des fichiers de modèle et des autres fichiers écrits dans ./outputs dans le compte de stockage associé à l’espace de travail
  8. Scale down du calcul, notamment la suppression du stockage temporaire

Si vous effectuez l’apprentissage sur votre ordinateur local (« configurer en tant qu’exécution locale »), Docker n’est pas obligatoire. Vous pouvez utiliser Docker localement si vous préférez (voir Configurer un pipeline ML pour obtenir un exemple).

Concepteur Azure Machine Learning

Le concepteur vous permet d’entraîner des modèles à l’aide d’une interface glisser-déplacer dans votre navigateur web.

Azure CLI (Interface de ligne de commande Azure)

L’interface CLI de Machine Learning est une extension d’Azure CLI. Il fournit des commandes multiplateformes pour l’utilisation d’Azure Machine Learning. En règle générale, une CLI sert à automatiser des tâches, par exemple pour entraîner un modèle de ML.

Étapes suivantes

Découvrez comment configurer une exécution d’entraînement.