Compartilhar via


Previsão (sem servidor) com AutoML

Importante

Esse recurso está em Visualização Pública.

Este artigo mostra como executar um experimento de previsão sem necessidade de servidor usando o Mosaic AI Model Training UI.

O Treinamento de Modelo de IA do Mosaico simplifica a previsão de dados de série temporal ao selecionar automaticamente o melhor algoritmo e hiperparâmetros, enquanto é executado em recursos de computação totalmente gerenciados.

Para entender a diferença entre a previsão sem servidor e a previsão de computação clássica, consulte previsão sem servidor versus previsão de computação clássica.

Requisitos

  • Dados de treinamento com uma coluna de série temporal, salva como uma tabela do Unity Catalog.

Criar um experimento de previsão com a interface do usuário

Vá para a página inicial do Azure Databricks e clique em Experimentos na barra lateral.

  1. No bloco Previsão , selecione Iniciar treinamento.

  2. Selecione os dados de treinamento em uma lista de tabelas do Catálogo do Unity que você pode acessar.

    • Coluna de tempo: selecione a coluna que contém os períodos de tempo da série temporal. As colunas devem ser do tipo timestamp ou date.
    • Frequência de previsão: selecione a unidade de tempo que representa a frequência dos dados de entrada. Por exemplo, minutos, horas, dias, meses. Isso determina a granularidade de sua série temporal.
    • Horizonte de previsão: especifique quantas unidades da frequência selecionada devem ser previstas para o futuro. Junto com a frequência de previsão, isso define as unidades de tempo e o número de unidades de tempo a serem previstas.

    Observação

    Para usar o algoritmo AUTO-ARIMA , a série temporal deve ter uma frequência regular em que o intervalo entre dois pontos deve ser o mesmo ao longo da série temporal. O AutoML manipula as etapas de tempo ausentes preenchendo esses valores com o valor anterior.

  3. Selecione uma coluna alvo de previsão que você deseja que o modelo preveja.

  4. Especifique, opcionalmente, um caminho de dados de previsão na tabela do Catálogo do Unity para armazenar as previsões de saída.

    Captura de tela da interface do usuário de previsão sem servidor.

  5. Selecione um local e um nome de registro de modelo do Catálogo do Unity.

  6. Opcionalmente, defina opções avançadas:

    • Nome do experimento: forneça um nome de experimento do MLflow.
    • Colunas do identificador de série temporal – para previsão de várias séries, selecione as colunas que identificam a série temporal individual. O Databricks agrupa os dados por essas colunas como séries temporais diferentes e treina um modelo para cada série de forma independente.
    • Métrica primária: escolha a métrica primária usada para avaliar e selecionar o melhor modelo.
    • Estrutura de treinamento: escolha as estruturas para o AutoML explorar.
    • Dividir coluna: selecione a coluna que contém a divisão de dados personalizada. Os valores devem ser "treinar", "validar", "testar"
    • Coluna de peso: especifique a coluna a ser usada para a ponderação de séries temporais. Todos os exemplos de uma determinada série temporal devem ter o mesmo peso. O peso deve estar no intervalo [0, 10000].
    • Região de férias: selecione a região de férias a ser usada como covariada no treinamento de modelo.
    • Tempo limite: defina uma duração máxima para o experimento AutoML.

Execute o experimento e monitore os resultados

Para iniciar o experimento autoML, clique em Iniciar o treinamento. Na página de treinamento do experimento, você pode fazer o seguinte:

  • Pare o experimento a qualquer momento.
  • Monitorar execuções.
  • Navegue até a página de execução para qualquer execução.

Além disso, você pode verificar o status do experimento conforme ele passa pelos seguintes estágios:

  1. Pré-processamento: Valide e prepare a tabela de entrada imputando valores ausentes e dividindo dados em conjuntos de treinamento, validação e teste. O processamento automático de geração de características, como a codificação binária para características categóricas, também é realizada durante esse estágio.
  2. Ajuste: Explore diferentes algoritmos de previsão e ajuste os hiperparâmetros.
  3. Formação: Treine e avalie o modelo final com as melhores configurações selecionadas. Registre o modelo no Catálogo do Unity se um caminho for especificado.

Exibir resultados ou usar o melhor modelo

Após a conclusão do treinamento, os resultados da previsão são armazenados na tabela Delta especificada e o melhor modelo é registrado no Catálogo do Unity.

Na página de experimentos, você escolhe entre as seguintes etapas:

  • Selecione Exibir previsões para ver a tabela de resultados de previsão.
  • Selecione o notebook de inferência em lote para abrir um notebook automaticamente gerado para inferência em lote usando o melhor modelo.
  • Selecione Criar ponto de serviço para implantar o melhor modelo em um ponto de serviço de Model Serving.

Previsão sem servidor versus previsão de computação clássica

A tabela a seguir resume as diferenças entre previsão sem servidor e previsão com computação clássica

Característica Previsão sem servidor Previsão de computação clássica
Infraestrutura de computação O Azure Databricks gerencia a configuração de computação e otimiza automaticamente o custo e o desempenho. Computação configurada pelo usuário
Governança Modelos e artefatos registrados no Catálogo do Unity Repositório de arquivos de workspace configurado pelo usuário
Escolha do algoritmo Modelos estatísticos mais o algoritmo de rede neural de aprendizado profundo DeepAR Modelos estatísticos
Integração do Feature Store Sem suporte Suportado
Notebooks gerados automaticamente Caderno de inferência em lote Código-fonte para todas as avaliações
Implantação de serviço de modelo de um clique Suportado Sem suporte
Divisões de treinamento/validação/teste personalizadas Suportado Sem suporte
Pesos personalizados para séries temporais individuais Suportado Sem suporte