Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Important
Cette fonctionnalité est disponible en préversion publique.
Cet article vous montre comment exécuter une expérience de prévision sans serveur en utilisant l'interface utilisateur de formation du modèle d'IA Mosaïque.
Formation de modèle IA Mosaic : la prévision des données de séries chronologiques est simplifiée en sélectionnant automatiquement le meilleur algorithme et les hyperparamètres, tout en s’exécutant sur des ressources de calcul entièrement managées.
Pour comprendre la différence entre la prévision serverless et la prévision de calcul classique, consultez la prévision serverless et la prévision de calcul classique.
Spécifications
- Données d’apprentissage avec une colonne de série chronologique, enregistrées sous forme de table de catalogue Unity.
- Si l’espace de travail a activé la passerelle de sortie sécurisée (SEG),
pypi.orgvous devez l’ajouter à la liste des domaines autorisés . Consultez Gérer les stratégies réseau pour le contrôle de sortie serverless.
Créer une expérience de prévision avec l’interface utilisateur
Accédez à votre page d’accueil Azure Databricks, puis cliquez sur Expériences dans la barre latérale.
Dans la vignette Prévision, sélectionnez Commencer l'entraînement.
Sélectionnez les données d’entraînement dans une liste de tables de catalogue Unity auxquelles vous pouvez accéder.
-
Colonne de temps : sélectionnez la colonne contenant les périodes de la série chronologique. Les colonnes doivent être de type
timestampoudate. - Fréquence de prévision : sélectionnez l’unité de temps qui représente la fréquence de vos données d’entrée. Par exemple, minutes, heures, jours, mois. Cela détermine la granularité de votre série chronologique.
- Horizon de prévision : spécifiez le nombre d’unités de la fréquence sélectionnée à prévoir dans l’avenir. Avec la fréquence de prévision, cela définit à la fois les unités de temps et le nombre d’unités de temps à prévoir.
Remarque
Pour utiliser l’algorithme Auto-ARIMA , la série chronologique doit avoir une fréquence régulière où l’intervalle entre deux points doit être le même tout au long de la série chronologique. AutoML gère les étapes de temps manquantes en remplissant ces valeurs avec la valeur précédente.
-
Colonne de temps : sélectionnez la colonne contenant les périodes de la série chronologique. Les colonnes doivent être de type
Sélectionnez une colonne cible de prédiction que vous souhaitez que le modèle prédit.
Si vous le souhaitez, spécifiez un chemin de table de Unity Catalog pour stocker les prévisions.
Sélectionnez un emplacement et un nom d'enregistrement de modèle du catalogue Unity .
Si vous le souhaitez, définissez les options avancées :
- Nom de l’expérience : fournissez un nom d’expérience MLflow.
- Colonnes d’identificateur de série chronologique : pour les prévisions multi-séries, sélectionnez la ou les colonnes qui identifient les séries chronologiques individuelles. Databricks regroupe les données selon ces colonnes en tant que séries chronologiques distinctes et entraîne un modèle indépendamment pour chaque série.
- Métrique principale : choisissez la métrique principale utilisée pour évaluer et sélectionner le meilleur modèle.
- Infrastructure de formation : choisissez les frameworks pour AutoML à explorer.
- Colonne fractionnée : sélectionnez la colonne contenant le fractionnement des données personnalisées. Les valeurs doivent être « entraînement », « validation », « test »
- Colonne de poids : spécifiez la colonne à utiliser pour la pondération des séries chronologiques. Tous les échantillons d’une série chronologique donnée doivent avoir le même poids. Le poids doit être dans la plage [0, 10000].
- Région de vacances : sélectionnez la région de vacances à utiliser comme covariées dans l’entraînement du modèle.
- Délai d’expiration : définissez une durée maximale pour l’expérience AutoML.
Exécuter l’expérience et vérifier les résultats
Pour démarrer l’expérience AutoML, cliquez sur Démarrer l’entraînement. Depuis la page de formation de l'expérience, vous pouvez effectuer les actions suivantes :
- Arrêtez l’expérience à tout moment.
- Surveiller les exécutions.
- Accédez à la page d’exécution de toutes les exécutions.
En outre, vous pouvez vérifier l’état de l’expérience à mesure qu’elle passe par les étapes suivantes :
- Prétraitement: Validez et préparez la table d’entrée en imputant des valeurs manquantes et en fractionnant les données en jeux d’apprentissage, de validation et de test. Le traitement automatique de génération de fonctionnalités, comme l’encodage à chaud pour les fonctionnalités catégorielles, se produit également pendant cette phase.
- Réglage: Explorez différents algorithmes de prévision et ajustez les hyperparamètres.
- Formation: Entraîner et évaluer le modèle final avec les meilleures configurations sélectionnées. Inscrivez le modèle dans le catalogue Unity si un chemin d’accès est spécifié.
Afficher les résultats ou utiliser le meilleur modèle
Une fois l’entraînement terminé, les résultats de prédiction sont stockés dans la table Delta spécifiée et le meilleur modèle est inscrit dans le catalogue Unity.
Dans la page des expériences, vous choisissez parmi les étapes suivantes :
- Sélectionnez Afficher les prédictions pour afficher la table des résultats de prévision.
- Sélectionnez bloc-notes d’inférence Batch pour ouvrir un bloc-notes généré automatiquement pour l’inférence par lots à l’aide du meilleur modèle.
- Sélectionnez Créer un point de terminaison de service pour déployer le meilleur modèle sur un point de terminaison de service de modèle.
Prévision serverless par rapport à la prévision de calcul classique
Le tableau suivant récapitule les différences entre la prévision serverless et la prévision avec le calcul classique
| Caractéristique | Prédiction sans serveur | Prévision de calcul classique |
|---|---|---|
| Infrastructure de calcul | Azure Databricks gère la configuration du calcul et optimise automatiquement les coûts et les performances. | Calcul configuré par l’utilisateur |
| Gouvernance | Modèles et artefacts inscrits dans le catalogue Unity | Magasin de fichiers configuré par l'utilisateur pour l'espace de travail |
| Sélection de l’algorithme | Modèles statistiques plus l’algorithme de réseau neuronal de l'apprentissage profond DeepAR | Modèles statistiques |
| Intégration du magasin de fonctionnalités | Non prise en charge | Pris en charge |
| Blocs-notes générés automatiquement | Bloc-notes d’inférence par lots | Code source pour toutes les versions d’évaluation |
| Déploiement d’un modèle en un clic | Soutenu | Non pris en charge |
| Fractionnements d’apprentissage/validation/test personnalisés | Soutenu | Non prise en charge |
| Pondérations personnalisées pour les séries chronologiques individuelles | Soutenu | Non prise en charge |