Explorar a arquitetura da solução

3 minutos

Vamos examinar a arquitetura que você decidiu para o fluxo de trabalho de MLOps (operações de machine learning) para entender onde e quando devemos verificar o código.

Diagrama da arquitetura de operações de machine learning.

Observação

O diagrama é uma representação simplificada de uma arquitetura de MLOps. Para exibir uma arquitetura mais detalhada, explore os vários casos de uso no acelerador de solução MLOps (v2).

A principal meta da arquitetura de MLOps é criar uma solução robusta e reproduzível. Para isso, a arquitetura inclui:

Configuração: crie todos os recursos necessários do Azure para a solução.
Desenvolvimento de modelo (loop interno): explore e processe os dados para treinar e avaliar o modelo.
Integração contínua: empacotar e registrar o modelo.
Implantação de modelo (loop externo): implante o modelo.
Implantação contínua: Teste o modelo e promova o ambiente de produção.
Monitoramento: monitore o desempenho do modelo e do ponto de extremidade.

Para mover um modelo do desenvolvimento para a implantação, você precisará de integração contínua. Durante a integração contínua, você empacotará e registrará o modelo. No entanto, antes de empacotar um modelo, você precisará verificar o código usado para treinar o modelo.

Junto com a equipe de ciência de dados, você concordou em usar o desenvolvimento baseado em tronco. Os branches não apenas protegerão o código de produção, eles também permitirão que você verifique automaticamente as alterações propostas antes de mesclá-las com o código de produção.

Vamos explorar o fluxo de trabalho para um cientista de dados:

Diagrama do desenvolvimento baseado em tronco, incluindo a verificação automática de código quando uma solicitação de pull é criada.

O código de produção é hospedado no branch principal .
Um cientista de dados cria uma feature branch para o desenvolvimento de modelos.
O cientista de dados cria uma solicitação de pull para propor o envio das alterações por push para a ramificação principal.
Quando uma solicitação de pull é criada, um fluxo de trabalho do GitHub Actions é disparado para verificar o código.
Quando o código é aprovado no lint e no teste de unidade, o cientista de dados líder precisa aprovar as alterações propostas.
Depois que o cientista de dados líder aprova as alterações, a solicitação de pull é mesclada e o ramo principal é atualizado adequadamente.

Como engenheiro de machine learning, você precisará criar um fluxo de trabalho do GitHub Actions que verifica o código executando um linter e testes de unidade sempre que uma solicitação pull é criada.

Dica

Saiba mais sobre como trabalhar com o controle do código-fonte para projetos de machine learning, incluindo desenvolvimento baseado em tronco e verificação local do código.

Comentários

Esta página foi útil?