Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Dans cet article, vous allez découvrir comment déployer un cluster Ray sur Azure Kubernetes Service (AKS) à l’aide de l’opérateur KubeRay. Vous allez également découvrir comment utiliser le cluster Ray pour entraîner un modèle simple d’apprentissage automatique et afficher les résultats sur le tableau de bord Ray.
Important
Les logiciels open source sont mentionnés dans la documentation et les exemples AKS. Les logiciels que vous déployez sont exclus des contrats de niveau de service AKS, de la garantie limitée et du support Azure. Quand vous utilisez une technologie open source avec AKS, consultez les options de support disponibles auprès des communautés et responsables de projet respectifs pour élaborer un plan.
Microsoft assume la responsabilité de la génération des packages open source que nous déployons sur AKS. Cette responsabilité comprend la maîtrise complète des processus de génération, d’analyse, de signature et de validation ainsi que l’application de correctifs logiciels et le contrôle des fichiers binaires présents dans les images conteneur. Pour plus d’informations, consultez Gestion des vulnérabilités pour AKS et Couverture du support AKS.
Qu’est-ce que Ray ?
Ray est un projet open source développé par le RISE Lab de l’UC Berkeley qui fournit une infrastructure unifiée pour la mise à l’échelle des applications Python et IA. Il se compose d’un runtime distribué principal et d’un ensemble de bibliothèques IA conçues pour accélérer les charges de travail d’apprentissage automatique.
Ray simplifie le processus d’exécution des tâches Python qui nécessitent beaucoup de calculs, ce qui vous permet de faire évoluer vos applications en toute transparence. L’infrastructure prend en charge diverses tâches d’apprentissage automatique, notamment l’entraînement distribué, l’optimisation des hyperparamètres, l’apprentissage par renforcement et la mise en service de modèles de production.
Pour plus d’informations, consultez le référentiel GitHub de Ray.
Qu’est-ce que KubeRay ?
KubeRay est un opérateur Kubernetes open source qui permet de déployer et de gérer des clusters Ray sur Kubernetes. KubeRay automatise le déploiement, la mise à l’échelle et la surveillance des clusters Ray. Il fournit un moyen déclaratif de définir les clusters Ray en utilisant les ressources personnalisées de Kubernetes, ce qui facilite la gestion des clusters Ray avec d’autres ressources Kubernetes.
Pour plus d’informations, consultez le référentiel GitHub de KubeRay.
Processus de déploiement de Ray
Le processus de déploiement comprend les étapes suivantes :
- Utilisez Terraform pour créer un fichier de plan local afin de définir l’état souhaité pour l’infrastructure AKS requise qui consiste en un groupe de ressources Azure, un pool de nœuds système dédié et un pool de nœuds de charge de travail pour Ray avec trois nœuds.
- Déployez un plan Terraform local sur Azure.
- Récupérez les sorties du déploiement Terraform et procurez-vous les informations d’identification Kubernetes pour le cluster AKS nouvellement déployé.
- Installez le référentiel Helm de Ray et déployez KubeRay sur le cluster AKS à l’aide de Helm.
- Téléchargez et exécutez un manifeste YAML de Ray Job à partir du référentiel d’échantillons Ray GitHub pour effectuer une classification d’images avec un ensemble de données MNIST à l’aide CNN (Convolutional Neural Networks).
- Extrayez les journaux d’activité de Ray Job afin de mieux comprendre le processus d’apprentissage automatique effectué par Ray.
Étape suivante
Contributeurs
Microsoft gère cet article. Les contributeurs suivants ont rédigé sa version d’origine :
- Russell de Pina | Responsable de programme technique principal
- Ken Kitty | Responsable de programme technique principal
- Erin Schaffer | Développeuse de contenu 2
- Adrian Joian | Ingénieur client principal
- Ryan Graham | Spécialiste technique principal