Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Dans SQL Server 2014 Enterprise, vous pouvez ajouter de nouvelles données à un modèle de série chronologique et incorporer automatiquement les nouvelles données dans le modèle. Vous ajoutez de nouvelles données à un modèle d’exploration de données de série chronologique de l’une des deux manières suivantes :
Utilisez une JOINTURE DE PRÉDICTION pour relier des données provenant d'une source externe aux données d'entraînement.
Utilisez une requête de prédiction singleton pour fournir des données d’une tranche à la fois.
Par exemple, supposons que vous avez entraîné le modèle d'exploration des données sur des données de ventes existantes il y a quelques mois. Lorsque vous obtenez de nouvelles ventes, vous pouvez mettre à jour les prédictions de ventes pour incorporer les nouvelles données. Vous pouvez le faire en une seule étape, en fournissant les nouvelles chiffres de vente en tant que données d’entrée et en générant de nouvelles prédictions basées sur le jeu de données composite.
Effectuer des prédictions avec EXTEND_MODEL_CASES
Voici des exemples génériques d’une prédiction de série chronologique à l’aide de EXTEND_MODEL_CASES. Le premier exemple vous permet de spécifier le nombre de prédictions à partir du dernier pas de temps du modèle original.
SELECT [<model columns>,] PredictTimeSeries(<table column reference>, n, EXTEND_MODEL_CASES)
FROM <mining model>
PREDICTION JOIN <source query>
[WHERE <criteria>]
Le deuxième exemple vous permet de spécifier l’étape de temps à laquelle les prédictions doivent démarrer et où elles doivent se terminer. Cette option est importante lorsque vous étendez les cas de modèle, car, par défaut, les étapes de temps utilisées pour les requêtes de prédiction commencent toujours à la fin de la série d’origine.
SELECT [<model columns>,] PredictTimeSeries(<table column reference>, n-start, n-end, EXTEND_MODEL_CASES)
FROM <mining model>
PREDICTION JOIN <source query>
[WHERE <criteria>}
Dans ce tutoriel, vous allez créer les deux types de requêtes.
Pour créer une requête de prédiction singleton sur un modèle de série temporelle
Dans l’Explorateur d’objets, cliquez avec le bouton droit sur l’instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.
L’Éditeur de requête s’ouvre et contient une nouvelle requête vide.
Copiez l’exemple générique de l’instruction singleton dans la requête vide.
Remplacez ce qui suit :
SELECT [<model columns>,] PredictTimeSeries(<table column reference>, n, EXTEND_MODEL_CASES)avec :
SELECT [Model Region], PredictTimeSeries([Quantity],6, EXTEND_MODEL_CASES) AS PredictQtyLa première ligne récupère une valeur du modèle qui identifie la série.
La deuxième ligne contient la fonction de prédiction, qui obtient 6 prédictions pour Quantity. Un alias
PredictQtyest affecté à la colonne des résultats de prédiction pour faciliter la compréhension des résultats.Remplacez ce qui suit :
FROM <mining model>avec :
FROM [Forecasting_MIXED]Remplacez ce qui suit :
PREDICTION JOIN <source query>avec :
NATURAL PREDICTION JOIN ( SELECT 1 AS [Reporting Date], '10' AS [Quantity], 'M200 Europe' AS [Model Region] UNION SELECT 2 AS [Reporting Date], 15 AS [Quantity]), 'M200 Europe' AS [Model Region] ) AS tRemplacez ce qui suit :
[WHERE <criteria>]avec :
WHERE [ModelRegion] = 'M200 Europe' OR [ModelRegion] = 'M200 Pacific'L’instruction complète doit maintenant être la suivante :
SELECT [Model Region], PredictTimeSeries([Quantity],6, EXTEND_MODEL_CASES) AS PredictQty FROM [Forecasting_MIXED] NATURAL PREDICTION JOIN SELECT 1 AS [ReportingDate], '10' AS [Quantity], 'M200 Europe' AS [ModelRegion] UNION SELECT 2 AS [ReportingDate], 15 AS [Quantity]), 'M200 Europe' AS [ModelRegion] ) AS t WHERE [ModelRegion] = 'M200 Europe' OR [ModelRegion] = 'M200 Pacific'Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx As.
Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier
Singleton_TimeSeries_Query.dmx.Dans la barre d’outils, cliquez sur le bouton Exécuter .
La requête retourne des prévisions du volume des ventes pour le vélo M200 dans les régions de l'Europe et du Pacifique.
Compréhension du démarrage de la prédiction avec EXTEND_MODEL_CASES
Maintenant que vous avez créé des prédictions basées sur le modèle d’origine et avec de nouvelles données, vous pouvez comparer les résultats pour voir comment la mise à jour des données de vente affecte les prédictions. Avant de le faire, passez en revue le code que vous venez de créer et notez les éléments suivants :
Vous avez fourni de nouvelles données uniquement pour la région Europe.
Vous n’avez fourni que deux mois de nouvelles données.
Le tableau suivant montre comment les nouvelles valeurs fournies pour M200 Europe affectent les prédictions. Vous n’avez pas fourni de nouvelles données pour le produit M200 dans la région Pacifique, mais cette série est présentée pour comparaison :
Produit et région : M200 Europe
Modèle existant (PredictTimeSeries) |
Modèle avec des données de ventes mises à jour (PredictTimeSeries avec EXTEND_MODEL_CASES) |
||
| M200 Europe | 25/7/2008 12:00:00 | 77 | 10 |
| M200 Europe | 25/8/2008 12:00:00 | 64 | 15 |
| M200 Europe | 25/9/2008 12:00:00 | 59 | 72 |
| M200 Europe | 25/10/2008 12:00:00 | 56 | 69 |
| M200 Europe | 11/25/2008 12:00:00 AM | 56 | 68 |
| M200 Europe | 25/12/2008 12:00:00 | 74 | 89 |
Produit et région : M200 Pacific
Modèle existant (PredictTimeSeries) |
Modèle avec des données de ventes mises à jour (PredictTimeSeries avec EXTEND_MODEL_CASES) |
||
| M200 Pacifique | 25/7/2008 12:00:00 | 41 | 41 |
| M200 Pacifique | 25/8/2008 12:00:00 | 44 | 44 |
| M200 Pacifique | 25/9/2008 12:00:00 | 38 | 38 |
| M200 Pacifique | 25/10/2008 12:00:00 | 41 | 41 |
| M200 Pacifique | 25/11/2008 00:00:00 | 36 | 36 |
| M200 Pacifique | 25/12/2008 12:00:00 | 39 | 39 |
À partir de ces résultats, vous pouvez voir deux choses :
Les deux premières prédictions pour la série M200 Europe sont exactement les mêmes que les nouvelles données que vous avez fournies. Conformément à sa conception, Analysis Services retourne les nouveaux points de données réels au lieu d’effectuer une prédiction. Cela est dû au fait que lorsque vous étendez les cas de modèle, les étapes de temps utilisées pour les requêtes de prédiction commencent toujours à la fin de la série d’origine. Par conséquent, si vous ajoutez deux nouveaux points de données, les deux premières prédictions retournées se chevauchent avec les nouvelles données.
Une fois que tous les nouveaux points de données sont utilisés, Analysis Services effectue des prédictions basées sur le modèle mis à jour. Par conséquent, à partir de septembre 2005, vous pouvez voir la différence entre les prédictions pour M200 Europe à partir du modèle d’origine, dans la colonne de gauche et le modèle qui utilise EXTEND_MODEL_CASES, dans la colonne de droite. Les prédictions sont différentes, car le modèle a été mis à jour avec les nouvelles données.
Utilisation des étapes de début et de fin pour contrôler les prédictions
Lorsque vous étendez un modèle, les nouvelles données sont toujours attachées à la fin de la série. Toutefois, à des fins de prédiction, les tranches de temps utilisées pour les requêtes de prédiction commencent à la fin de la série d’origine. Si vous souhaitez obtenir uniquement les nouvelles prédictions lorsque vous ajoutez les nouvelles données, vous devez spécifier le point de départ comme un certain nombre de tranches de temps. Par exemple, si vous ajoutez deux nouveaux points de données et que vous souhaitez effectuer quatre nouvelles prédictions, procédez comme suit :
Créez une JOINTURE DE PRÉDICTION sur un modèle de série chronologique et spécifiez deux mois de nouvelles données.
Demander des prédictions pour quatre segments de temps, où le début est 3, et la fin est le segment de temps 6.
En d’autres termes, si vos nouvelles données contiennent n tranches de temps et que vous demandez des prédictions pour les étapes de temps 1 à n, les prédictions coïncident avec la même période que les nouvelles données. Pour obtenir de nouvelles prédictions pour une période non couverte par vos données, vous devez démarrer des prédictions au niveau de la tranche de temps n+1 après la nouvelle série de données, ou vous assurer que vous demandez des tranches de temps supplémentaires.
Remarque
Vous ne pouvez pas effectuer de prédictions historiques lorsque vous ajoutez de nouvelles données.
L’exemple suivant montre l’instruction DMX qui vous permet d’obtenir uniquement les nouvelles prédictions pour les deux séries de l’exemple précédent.
SELECT [Model Region],
PredictTimeSeries([Quantity],3,6, EXTEND_MODEL_CASES) AS PredictQty
FROM
[Forecasting_MIXED]
NATURAL PREDICTION JOIN
SELECT 1 AS [ReportingDate],
'10' AS [Quantity],
'M200 Europe' AS [ModelRegion]
UNION SELECT
2 AS [ReportingDate],
15 AS [Quantity]),
'M200 Europe' AS [ModelRegion]
) AS t
WHERE [ModelRegion] = 'M200 Europe'
Les résultats de prédiction commencent à la tranche 3, qui se trouve après les 2 mois de nouvelles données que vous avez fournies.
Produit et région : M200 Europe
Modèle avec des données mises à jour (PredictTimeSeries avec EXTEND_MODEL_CASES)
| M200 Europe | 25/9/2008 12:00:00 | 72 |
| M200 Europe | 25/10/2008 12:00:00 | 69 |
| M200 Europe | 25/11/2008 00:00:00 | 68 |
| M200 Europe | 25/12/2008 12:00:00 | 89 |
Effectuer des prédictions avec REPLACE_MODEL_CASES
Le remplacement des cas de modèle est utile lorsque vous souhaitez entraîner un modèle sur un ensemble de cas, puis appliquer ce modèle à une autre série de données. Une procédure pas à pas détaillée de ce scénario est présentée dans la leçon 2 : Création d’un scénario de prévision (didacticiel sur l’exploration de données intermédiaire).
Voir aussi
Exemples de requêtes de modèle de série chronologique
PredictTimeSeries (DMX)