Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo, aprenderá a implementar un clúster de Ray en Azure Kubernetes Service (AKS) mediante el operador KubeRay. También aprenderá a usar el clúster de Ray para entrenar un modelo de aprendizaje automático sencillo y mostrar los resultados en el panel de Ray.
Importante
El software de código abierto se menciona en toda la documentación y ejemplos de AKS. El software que implemente se excluye de los contratos de nivel de servicio de AKS, la garantía limitada y el Soporte técnico de Azure. A medida que usa la tecnología de código abierto junto con AKS, consulte las opciones de soporte técnico disponibles en las comunidades y los mantenedores de proyectos respectivos para desarrollar un plan.
Microsoft asume la responsabilidad de crear los paquetes de código abierto que implementamos en AKS. Esa responsabilidad incluye tener la propiedad completa del proceso de compilación, examen, firma, validación y revisión, junto con el control sobre los archivos binarios en imágenes de contenedor. Para obtener más información, consulte Administración de vulnerabilidades para AKS y cobertura de soporte técnico de AKS.
¿Qué es Ray?
Ray es un proyecto de código abierto desarrollado en el Laboratorio RISE de UC Berkeley que proporciona un marco unificado para escalar aplicaciones de IA y Python. Consta de un entorno de ejecución distribuido principal y un conjunto de bibliotecas de IA diseñadas para acelerar las cargas de trabajo de aprendizaje automático.
Ray simplifica el proceso de ejecutar tareas de Python intensivas en proceso a escala, lo que le permite escalar sin problemas las aplicaciones. El marco admite varias tareas de aprendizaje automático, como el entrenamiento distribuido, el ajuste de hiperparámetros, el aprendizaje de refuerzo y el modelo de producción.
Para obtener más información, consulte el repositorio de GitHub de Ray.
¿Qué es KubeRay?
KubeRay es un operador de Kubernetes de código abierto para implementar y administrar clústeres de Ray en Kubernetes. KubeRay automatiza la implementación, el escalado y la supervisión de clústeres de Ray. Proporciona una manera declarativa de definir clústeres de Ray mediante recursos personalizados de Kubernetes, lo que facilita la administración de clústeres de Ray junto con otros recursos de Kubernetes.
Para obtener más información, consulte el repositorio de GitHub de KubeRay.
Proceso de implementación de Ray
El proceso de implementación consta de los pasos siguientes:
- Use Terraform para crear un archivo de plan local para definir el estado deseado para la infraestructura necesaria de AKS que consta de un grupo de recursos de Azure, un grupo de nodos del sistema dedicado y un grupo de nodos de carga de trabajo para Ray con tres nodos.
- Implemente un plan de Terraform local en Azure.
- Recupere las salidas de la implementación de Terraform y obtenga las credenciales de Kubernetes en el clúster de AKS recién implementado.
- Instale el repositorio de Helm Ray e implemente KubeRay en el clúster de AKS mediante Helm.
- Descargue y ejecute un manifiesto de Ray Job YAML desde el repositorio de ejemplos de GitHub de Ray para realizar una clasificación de imágenes con un conjunto de datos de MNIST mediante redes neuronales convolucionales (CNN).
- Genera los registros del trabajo de Ray para obtener información sobre el proceso de aprendizaje automático realizado por Ray.
Paso siguiente
Colaboradores
Microsoft se encarga del mantenimiento de este artículo. Los siguientes colaboradores lo escribieron originalmente:
- Russell de Pina | TPM de entidad de seguridad
- Ken Kilty | TPM de entidad de seguridad
- Erin Schaffer | Desarrollador de contenido 2
- Adrian Joian | Ingeniero principal de clientes
- Ryan Graham | Especialista principal técnico