Partager via


Prédictions avancées de séries chronologiques (didacticiel intermédiaire sur l'exploration de données)

Vous avez vu l’exploration du modèle de prévision qui, bien que les ventes dans la plupart des régions suivent un modèle similaire, certaines régions et certains modèles, tels que le modèle M200 dans la région du Pacifique, présentent des tendances très différentes. Cela ne vous étonne pas, car vous savez que les différences entre les régions sont courantes et peuvent être causées par de nombreux facteurs, notamment des promotions marketing, des rapports inexacts ou des événements géopolitiques.

Toutefois, vos utilisateurs demandent un modèle qui peut être appliqué dans le monde entier. Par conséquent, pour réduire l’effet des facteurs individuels sur les projections, vous décidez de créer un modèle basé sur des mesures agrégées des ventes mondiales. Vous pouvez ensuite utiliser ce modèle pour effectuer des prédictions pour chaque région individuelle.

Dans cette tâche, vous allez générer toutes les sources de données dont vous avez besoin pour effectuer les tâches de prédiction avancées. Vous allez créer deux vues de source de données à utiliser comme entrées dans la requête de prédiction et une vue de source de données à utiliser pour créer un nouveau modèle.

Étapes

  1. Préparer les données de ventes étendues (pour la prédiction)

  2. Préparer les données agrégées (pour créer le modèle)

  3. Préparer les données de série (pour la prédiction croisée)

  4. Prédire à l’aide de EXTEND

  5. Créer le modèle de prédiction croisée

  6. Prédire à l’aide de REPLACE

  7. Passer en revue les nouvelles prédictions

Création des données étendues de ventes

Pour mettre à jour vos données de ventes, vous devez obtenir les derniers chiffres de vente. Ce qui intéresse particulièrement, ce sont les données récemment arrivées de la région du Pacifique, qui a lancé une promotion régionale des ventes pour attirer l’attention sur les nouveaux magasins et sensibiliser les gens à leurs produits.

Pour ce scénario, nous partons du principe que les données ont été importées à partir d’un classeur Excel qui contient seulement trois mois de nouvelles données pour quelques régions. Vous allez créer une table pour les données à l’aide d’un script Transact-SQL, puis définir une vue de source de données à utiliser pour la prédiction.

Créer la table avec de nouvelles données de vente

  1. Dans une fenêtre de requête Transact-SQL, exécutez l’instruction suivante pour ajouter les données de vente à la base de données AdventureWorksDW (ou toute autre base de données).

    USE [database name];  
    GO  
    IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL   
        DROP TABLE [dbo].[NewSalesData];  
    GO  
    CREATE TABLE [dbo].[NewSalesData]([Series] [nvarchar](255) NULL,  
    [NewDate] [datetime] NULL,  
    [NewQty] [float] NULL,  
    [NewAmount] [money] NULL) ON [PRIMARY]  
    
    GO  
    
  2. Insérez les nouvelles valeurs à l’aide du script suivant.

    INSERT INTO [NewSalesData]  
    (Series,NewDate,NewQty,NewAmount)  
    VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'),  
    ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '),  
    ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '),  
    ('T1000 Europe', '7/25/08', 37, '$88,210.00 '),  
    ('T1000 Europe', '8/25/08', 41, '$97,746.00 '),  
    ('T1000 Europe', '9/25/08', 37, '$88,210.00 '),  
    ('T1000 North America', '7/25/08', 69, '$164,500.00 '),  
    ('T1000 North America', '8/25/08', 66, '$157,348.00 '),  
    ('T1000 North America', '9/25/08', 58, '$138,276.00 '),  
    ('M200 Pacific', '7/25/08', 65, '$149,824.35'),  
    ('M200 Pacific', '8/25/08', 54,  '$124,619.46'),  
    ('M200 Pacific', '9/25/08', 61, '$141,143.39'),  
    ('M200 Europe', '7/25/08', 75, '$173,026.00'),  
    ('M200 Europe', '8/25/08', 76, '$175,212.00'),  
    ('M200 Europe', '9/25/08', 84, '$193,731.00'),  
    ('M200 North America', '7/25/08', 94, '$216,916.00'),  
    ('M200 North America', '8/25/08', 94, '$216,891.00'),  
    ('M200 North America', '9/25/08', 91,'$209,943.00');  
    

    Avertissement

    Les guillemets sont utilisés avec les valeurs monétaires pour éviter les problèmes liés au séparateur de virgules et au symbole monétaire. Vous pouvez également transmettre les valeurs monétaires au format suivant : 130170.22

    Notez que les dates utilisées dans l’exemple de base de données ont changé pour cette version. Si vous utilisez une édition antérieure d’AdventureWorks, vous devrez peut-être ajuster les dates insérées en conséquence.

Créer une vue de source de données à l’aide des nouvelles données de vente

  1. Dans l’Explorateur de solutions, cliquez avec le bouton droit sur Vues de source de données, puis sélectionnez Nouvelle vue de source de données.

  2. Dans l’Assistant Vue de source de données, effectuez les sélections suivantes :

    Source de données : Adventure Works DW Multidimensionnel 2012

    Sélectionnez Tables et vues : sélectionnez la table que vous venez de créer, NewSalesData.

  3. Cliquez sur Terminer.

  4. Dans l’aire de conception de la Vue de la source de données, cliquez avec le bouton droit sur NewSalesData, puis sélectionnez Explorer les données pour vérifier les données.

Avertissement

Vous utiliserez ces données uniquement pour la prédiction. Il n’est donc pas important que les données soient incomplètes.

Création des données pour le modèle de prédiction croisée

Les données utilisées dans le modèle de prévision d’origine ont déjà été regroupées quelque peu par la vue vTimeSeries, qui a réduit plusieurs modèles de vélo en un plus petit nombre de catégories, et a fusionné les résultats de différents pays en régions. Pour créer un modèle qui peut être utilisé pour les projections à l’échelle mondiale, vous allez créer des agrégations simples supplémentaires directement dans le Concepteur de vues de source de données. La nouvelle vue de source de données contient uniquement une somme et une moyenne des ventes de tous les produits pour toutes les régions.

Une fois que vous avez créé la source de données utilisée pour le modèle, vous devez créer une vue de source de données à utiliser pour la prédiction. Par exemple, si vous souhaitez prédire les ventes pour l’Europe à l’aide du nouveau modèle mondial, vous devez alimenter uniquement les données de la région Europe. Vous allez donc configurer une nouvelle vue de source de données qui filtre les données d’origine et modifier la condition de filtre pour chaque ensemble de requêtes de prédiction.

Pour créer les données du modèle à l’aide d’une vue de source de données personnalisée

  1. Dans l’Explorateur de solutions, cliquez avec le bouton droit sur Vues de source de données, puis sélectionnez Nouvelle vue de source de données.

  2. Sur la page d'accueil de l'Assistant, cliquez sur Suivant.

  3. Dans la page Sélectionner une source de données , sélectionnez Adventure Works Multidimensional 2012, puis cliquez sur Suivant.

  4. Dans la page, sélectionnez des tables et des vues, n’ajoutez pas de tables en cliquant simplement sur Suivant.

  5. Sur la page Achèvement de l’Assistant, tapez le nom AllRegions, puis cliquez sur Terminer.

  6. Ensuite, clic droit sur la surface de conception de la vue de la source de données vide, puis sélectionnez Nouvelle requête nommée.

  7. Dans la boîte de dialogue Créer une requête nommée , pour nom, type AllRegionset description, tapez Somme et moyenne des ventes pour tous les modèles et régions.

  8. Dans le volet de texte SQL, tapez l’instruction suivante, puis cliquez sur OK :

    SELECT ReportingDate,   
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,  
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,  
    'All Regions' as [Region]  
    FROM dbo.vTimeSeries   
    GROUP BY ReportingDate  
    
  9. Cliquez avec le bouton droit sur la AllRegions table, puis sélectionnez Explorer les données.

Pour créer les données de série pour la prédiction croisée

  1. Dans l’Explorateur de solutions, cliquez avec le bouton droit sur Vues de source de données, puis sélectionnez Nouvelle vue de source de données.

  2. Dans l’Assistant Vue de source de données, effectuez les sélections suivantes :

    Source de données : Adventure Works DW Multidimensionnel 2012

    Sélectionner des tables et des vues : ne sélectionnez aucune table

    Nom : T1000 Pacific Region

  3. Cliquez sur Terminer.

  4. Cliquez avec le bouton droit sur l’aire de conception vide pour T1000 Pacific Region.dsv, puis sélectionnez Nouvelle requête nommée.

    La boîte de dialogue Créer une requête nommée s’affiche. Retapez le nom, puis ajoutez la description suivante :

    Nom : T1000 Pacific Region

    Description : FiltrervTimeSeriespar région et modèle

  5. Dans le volet de texte, tapez la requête suivante, puis cliquez sur OK :

    SELECT ReportingDate, ModelRegion, Quantity, Amount  
    FROM dbo.vTimeSeries  
    WHERE (ModelRegion = N'T1000 Pacific')  
    

    Remarque

    Étant donné que vous devez créer des prédictions pour chaque série séparément, vous pouvez copier le texte de la requête et l’enregistrer dans un fichier texte afin de pouvoir l’utiliser à nouveau pour les autres séries de données.

  6. Dans l’aire de conception de la vue de source de données, cliquez avec le bouton droit sur T1000 Pacific, puis sélectionnez Explorer les données pour vérifier que les données sont filtrées correctement.

    Vous utiliserez ces données comme entrée du modèle lors de la création de requêtes de prédiction croisée.

Tâche suivante de la leçon

Prédictions de série chronologique à l’aide de données mises à jour (didacticiel sur l’exploration de données intermédiaire)

Voir aussi

Algorithme Microsoft Time Series
Informations techniques de référence sur l’algorithme Microsoft Time Series
Vues de source de données dans les modèles multidimensionnels