Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Nesse artigo, você aprenderá como implantar um cluster Ray no AKS (Azure Kubernetes Service) usando o operador KubeRay. Você também aprenderá a usar o cluster Ray para treinar um modelo simples de aprendizado de máquina e exibir os resultados no Painel do Ray.
Importante
O software de código aberto é mencionado em toda a documentação e amostras do AKS. O software que você implanta está excluído dos contratos de nível de serviço do AKS, garantia limitada e Suporte do Azure. Ao usar tecnologia de código aberto junto com o AKS, consulte as opções de suporte disponíveis nas comunidades e mantenedores de projetos respectivos para desenvolver um plano.
A Microsoft assume a responsabilidade por criar os pacotes de código aberto que implantamos no AKS. Essa responsabilidade inclui ter propriedade completa do processo de criação, verificação, sinalização, validação e hotfix, junto com o controle sobre os binários em imagens de contêiner. Para obter mais informações, consulte Gerenciamento de vulnerabilidades para o AKS e Cobertura de suporte do AKS.
O que é o Ray?
Ray é um projeto de código aberto desenvolvido no RISE Lab da UC Berkeley que fornece uma estrutura unificada para dimensionar aplicativos de IA e Python. Ele consiste em um tempo de execução distribuído central e um conjunto de bibliotecas de IA projetadas para acelerar cargas de trabalho de aprendizado de máquina.
O Ray simplifica o processo de execução de tarefas Python que exigem muita computação em escala, permitindo que você dimensione seus aplicativos sem problemas. A estrutura oferece suporte a várias tarefas de aprendizado de máquina, incluindo treinamento distribuído, ajuste de hiperparâmetros, aprendizado por reforço e disponibilização de modelos de produção.
Para obter mais informações, consulte Repositório do GitHub do Ray.
O que é KubeRay?
KubeRay é um operador Kubernetes de código aberto para implantar e gerenciar clusters Ray no Kubernetes. O KubeRay automatiza a implantação, o dimensionamento e o monitoramento de clusters Ray. Ele fornece uma maneira declarativa de definir clusters Ray usando recursos personalizados do Kubernetes, facilitando o gerenciamento de clusters Ray juntamente com outros recursos do Kubernetes.
Para obter mais informações, consulte o Repositório do GitHub do KubeRay.
Processo de implantação do Ray
O processo de implantação consiste nos seguintes passos:
- Use o Terraform para criar um arquivo de plano local para definir o estado desejado para a infraestrutura necessária do AKS, que consiste em um grupo de recursos do Azure, um pool de nós do sistema dedicado e um pool de nós de carga de trabalho para o Ray com três nós.
- Implante um plano local do Terraform no Azure.
- Recupere saídas da implantação do Terraform e obtenha credenciais do Kubernetes para o cluster AKS recém-implantado.
- Instale o repositório Helm Ray e implante o KubeRay no cluster AKS usando o Helm.
- Baixe e execute um manifesto Ray Job YAML do repositório de amostras do Ray GitHub para executar uma classificação de imagem com um conjunto de dados do MNIST usando Redes Neurais Convolucionais (CNNs).
- Produza os logs do Ray Job para obter insights sobre o processo de aprendizado de máquina realizado pelo Ray.
Próxima etapa
Colaboradores
A Microsoft atualiza este artigo. Os seguintes colaboradores o escreveram originalmente:
- Russell de Pina | Diretor de TPM
- Ken Kilty | Diretor de TPM
- Erin Schaffer | Desenvolvedora de Conteúdo 2
- Adrian Joian | Engenheiro Chefe de Clientes
- Ryan Graham | Especialista Técnico Principal