Prévision (serverless) avec AutoML

Important

Cette fonctionnalité est disponible en préversion publique.

Cet article vous montre comment exécuter une expérience de prévision sans serveur en utilisant l'interface utilisateur de formation du modèle d'IA Mosaïque.

Formation de modèle IA Mosaic : la prévision des données de séries chronologiques est simplifiée en sélectionnant automatiquement le meilleur algorithme et les hyperparamètres, tout en s’exécutant sur des ressources de calcul entièrement managées.

Pour comprendre la différence entre la prévision serverless et la prévision de calcul classique, consultez la prévision serverless et la prévision de calcul classique.

Spécifications

Données d’apprentissage avec une colonne de série chronologique, enregistrées sous forme de table de catalogue Unity.

Si l’espace de travail a activé la passerelle de sortie sécurisée (SEG), pypi.org vous devez l’ajouter à la liste des domaines autorisés . Consultez Gérer les stratégies réseau pour le contrôle de sortie serverless.

Créer une expérience de prévision avec l’interface utilisateur

Accédez à votre page d’accueil Azure Databricks, puis cliquez sur Expériences dans la barre latérale.

Dans la vignette Prévision, sélectionnez Commencer l'entraînement.
Sélectionnez les données d’entraînement dans une liste de tables de catalogue Unity auxquelles vous pouvez accéder.
- Colonne de temps : sélectionnez la colonne contenant les périodes de la série chronologique. Les colonnes doivent être de type timestamp ou date.
- Fréquence de prévision : sélectionnez l’unité de temps qui représente la fréquence de vos données d’entrée. Par exemple, minutes, heures, jours, mois. Cela détermine la granularité de votre série chronologique.
- Horizon de prévision : spécifiez le nombre d’unités de la fréquence sélectionnée à prévoir dans l’avenir. Avec la fréquence de prévision, cela définit à la fois les unités de temps et le nombre d’unités de temps à prévoir.
Remarque

Pour utiliser l’algorithme Auto-ARIMA , la série chronologique doit avoir une fréquence régulière où l’intervalle entre deux points doit être le même tout au long de la série chronologique. AutoML gère les étapes de temps manquantes en remplissant ces valeurs avec la valeur précédente.
Sélectionnez une colonne cible de prédiction que vous souhaitez que le modèle prédit.
Si vous le souhaitez, spécifiez un chemin de table de Unity Catalog pour stocker les prévisions.
Sélectionnez un emplacement et un nom d'enregistrement de modèle du catalogue Unity .
Si vous le souhaitez, définissez les options avancées :
- Nom de l’expérience : fournissez un nom d’expérience MLflow.
- Colonnes d’identificateur de série chronologique : pour les prévisions multi-séries, sélectionnez la ou les colonnes qui identifient les séries chronologiques individuelles. Databricks regroupe les données selon ces colonnes en tant que séries chronologiques distinctes et entraîne un modèle indépendamment pour chaque série.
- Métrique principale : choisissez la métrique principale utilisée pour évaluer et sélectionner le meilleur modèle.
- Infrastructure de formation : choisissez les frameworks pour AutoML à explorer.
- Colonne fractionnée : sélectionnez la colonne contenant le fractionnement des données personnalisées. Les valeurs doivent être « entraînement », « validation », « test »
- Colonne de poids : spécifiez la colonne à utiliser pour la pondération des séries chronologiques. Tous les échantillons d’une série chronologique donnée doivent avoir le même poids. Le poids doit être dans la plage [0, 10000].
- Région de vacances : sélectionnez la région de vacances à utiliser comme covariées dans l’entraînement du modèle.
- Délai d’expiration : définissez une durée maximale pour l’expérience AutoML.

Exécuter l’expérience et vérifier les résultats

Pour démarrer l’expérience AutoML, cliquez sur Démarrer l’entraînement. Depuis la page de formation de l'expérience, vous pouvez effectuer les actions suivantes :

Arrêtez l’expérience à tout moment.
Surveiller les exécutions.
Accédez à la page d’exécution de toutes les exécutions.

En outre, vous pouvez vérifier l’état de l’expérience à mesure qu’elle passe par les étapes suivantes :

Prétraitement: Validez et préparez la table d’entrée en imputant des valeurs manquantes et en fractionnant les données en jeux d’apprentissage, de validation et de test. Le traitement automatique de génération de fonctionnalités, comme l’encodage à chaud pour les fonctionnalités catégorielles, se produit également pendant cette phase.
Réglage: Explorez différents algorithmes de prévision et ajustez les hyperparamètres.
Formation: Entraîner et évaluer le modèle final avec les meilleures configurations sélectionnées. Inscrivez le modèle dans le catalogue Unity si un chemin d’accès est spécifié.

Afficher les résultats ou utiliser le meilleur modèle

Une fois l’entraînement terminé, les résultats de prédiction sont stockés dans la table Delta spécifiée et le meilleur modèle est inscrit dans le catalogue Unity.

Dans la page des expériences, vous choisissez parmi les étapes suivantes :

Sélectionnez Afficher les prédictions pour afficher la table des résultats de prévision.
Sélectionnez bloc-notes d’inférence Batch pour ouvrir un bloc-notes généré automatiquement pour l’inférence par lots à l’aide du meilleur modèle.
Sélectionnez Créer un point de terminaison de service pour déployer le meilleur modèle sur un point de terminaison de service de modèle.

Prévision serverless par rapport à la prévision de calcul classique

Le tableau suivant récapitule les différences entre la prévision serverless et la prévision avec le calcul classique

Caractéristique	Prédiction sans serveur	Prévision de calcul classique
Infrastructure de calcul	Azure Databricks gère la configuration du calcul et optimise automatiquement les coûts et les performances.	Calcul configuré par l’utilisateur
Gouvernance	Modèles et artefacts inscrits dans le catalogue Unity	Magasin de fichiers configuré par l'utilisateur pour l'espace de travail
Sélection de l’algorithme	Modèles statistiques plus l’algorithme de réseau neuronal de l'apprentissage profond DeepAR	Modèles statistiques
Intégration du magasin de fonctionnalités	Non prise en charge	Pris en charge
Blocs-notes générés automatiquement	Bloc-notes d’inférence par lots	Code source pour toutes les versions d’évaluation
Déploiement d’un modèle en un clic	Soutenu	Non pris en charge
Fractionnements d’apprentissage/validation/test personnalisés	Soutenu	Non prise en charge
Pondérations personnalisées pour les séries chronologiques individuelles	Soutenu	Non prise en charge

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2025-05-10