Partager via


Création d’un modèle d’exploration de données

La modélisation des données est l’étape de l’exploration de données où vous générez des modèles et des tendances en appliquant des algorithmes aux données. Plus tard, vous pouvez utiliser ces modèles pour l’analyse ou pour effectuer des prédictions.

Les compléments d’exploration de données pour Office prennent en charge l’exploration de données via des assistants qui facilitent la création de modèles de data mining. Les Assistants analysent les données, identifient les corrélations, calculent la signification statistique de toutes les variables et sélectionnent automatiquement le meilleur modèle.

Bien que cette fonctionnalité soit tout aussi puissante que les outils d’exploration de données fournis par SQL Server Analysis Services et SQL Server Data Tools (SSDT), la combinaison d’Assistants et de l’interface Excel familière facilite la création, la modification et l’utilisation de l’exploration de données.

Avancé (exploration de données)

Les Assistants Avancés vous permettent de créer de nouveaux modèles d’exploration de données, basés sur les données stockées dans Excel, à l’aide de l’un des algorithmes d’exploration de données dans SQL Server Analysis Services.

Créer une structure d’exploration de données

L’Assistant Création d’une structure d’exploration de données vous aide à créer une nouvelle structure d’exploration de données, que vous pouvez utiliser comme base pour plusieurs modèles d’exploration de données. L’Assistant vous donne la possibilité de réserver une partie des données à utiliser en tant que jeu de tests, afin que vous puissiez évaluer tous les modèles qui utilisent les mêmes données en fonction d’une norme de test cohérente.

Créer une structure d’exploration de données (compléments d’exploration de données SQL Server)

Ajouter un modèle à la structure

L'Assistant Ajouter un modèle à la structure vous permet de choisir une structure d’exploration de données existante et de créer un nouveau modèle d’exploration de données pour celle-ci. Vous pouvez ajouter plusieurs modèles d’exploration de données à une structure, modifier les paramètres ou choisir différents algorithmes d’exploration de données et personnaliser la sortie.

Ajouter un modèle à la structure (compléments d’exploration de données pour Excel)

Analyser les influenceurs clés (Analyser)

Vous choisissez une colonne ou une valeur de sortie intéressante, puis l’algorithme analyse toutes les données d’entrée pour identifier les facteurs qui ont le plus d’influence sur la cible. Si vous le souhaitez, vous pouvez créer un rapport qui compare deux valeurs, afin de voir comment les influenceurs changent.

L’outil Analyser les influenceurs clés utilise l’algorithme Microsoft Naïve Bayes.

Analyser les influenceurs clés (Outils d’analyse de tableau pour Excel)

Associé (exploration de données)

L’Assistant Associé crée un modèle d’association qui détecte les associations entre les éléments qui apparaissent dans plusieurs transactions : par exemple, dans l’analyse du panier de marché.

Assistant d'Association (Exploration de données client pour Excel)

Classifier (exploration de données)

L’Assistant Classifier génère un modèle de classification qui analyse les facteurs qui ont contribué à un résultat cible. Vous pouvez utiliser plusieurs algorithmes avec cet Assistant, notamment Decision Trees, Naïve Bayes et Neural Networks.

Assistant de Classification (Compléments d’exploration de données pour Excel)

Cluster (exploration de données)

L’Assistant Cluster génère un modèle de clustering qui détecte les groupes de lignes qui partagent des caractéristiques similaires. Le clustering (parfois appelé segmentation) est une technique d’apprentissage non supervisée qui est très utile lorsque vous essayez de comprendre les modèles et les regroupements dans de nouvelles données.

L’algorithme de clustering Microsoft prend en charge plusieurs variétés de clustering en K-moyennes et de maximisation des espérances (EM)

Assistant de regroupement (Compléments d’exploration de données pour Excel).

Détecter les catégories (analyser)

L’outil Détecter les catégories vous permet d’ajouter n’importe quel jeu de données et d’appliquer un clustering pour rechercher des regroupements de données. Il est utile de trouver des similitudes et de créer des groupes pour analyser davantage.

L’outil Détecter les catégories utilise l’algorithme de clustering de Microsoft.

Détecter les catégories (Outils d’analyse de tableau pour Excel)

Estimation (exploration de données)

L’Assistant Estimation génère un modèle d’estimation qui extrait des schémas de données et utilise ces schémas pour prédire des valeurs numériques, de date ou de temps continues. Il utilise l’algorithme Microsoft Decision Trees.

Assistant d'Estimation (Compléments d’exploration de données pour Excel)

Remplir d'après un exemple (Analyse)

L’outil Fill From Example vous aide à imputer des valeurs manquantes. Vous fournissez des exemples de valeurs manquantes, et l’outil génère des modèles basés sur toutes les données de la table, puis recommande de nouvelles valeurs basées sur des modèles dans les données.

L’outil Fill From Example utilise l’algorithme Microsoft Logistic Regression.

Remplir d'après un exemple (Outils d’analyse de tableau pour Excel)

Prévision (Analyser)

L’outil Prévision prend des données qui changent au fil du temps et prédit les valeurs futures.

L’outil Prévision utilise l’algorithme Microsoft Time Series.

Prévision (Outils d’analyse de tableau pour Excel)

Prévision (exploration de données)

L’Assistant Prévision génère un modèle de prévision qui détecte les schémas dans une série de cellules données, puis génère des prévisions pour des valeurs supplémentaires.

Assistant Prévision (Compléments d’exploration de données pour Excel)

Mettre en surbrillance les exceptions (analyser)

L’outil Mettre en surbrillance exceptions analyse les modèles d’une table de données et recherche des lignes et des valeurs qui ne correspondent pas au modèle. Vous pouvez ensuite les examiner et les corriger et réexécuter le modèle ou marquer des valeurs pour une action ultérieure.

L’outil Mettre en surbrillance les exceptions utilise l’algorithme de clustering Microsoft.

Mettre en surbrillance les exceptions (Outils d’analyse de tableau pour Excel)

Calculateur de Prédiction (Analyse)

Cet outil crée un modèle qui analyse les facteurs conduisant aux résultats cibles, puis prédit un résultat pour toute nouvelle entrée, en fonction des critères dérivés de ces modèles, il génère également une feuille de calcul interactive de prise de décision qui vous permet de noter facilement de nouvelles entrées. Vous pouvez également créer une version imprimée de la feuille de calcul de scoring pour une utilisation hors connexion.

L’outil Calculatrice de prédiction utilise l’algorithme Microsoft Logistic Regression.

Calculatrice de prédiction (Outils d’analyse de tableau pour Excel)

Scénario : Recherche d’objectif (analyser)

Dans l’outil Recherche d’objectif , vous spécifiez une valeur cible et l’outil identifie les facteurs sous-jacents qui doivent changer pour répondre à cette cible. Par exemple, si vous savez que vous devez augmenter la satisfaction des appels de 20%, vous pouvez demander au modèle de prédire les facteurs qui doivent changer pour produire cet objectif.

L’outil Goal Seek utilise l’algorithme Microsoft Logistic Regression.

Détails

Scénario de recherche d’objectif (Outils d’analyse de tableau pour Excel)

Scénario : scénario What-If (Analyser)

L’outil d’analyseWhat-If complète l’outil Recherche d’objectifs. Avec cet outil, vous avez entré la valeur que vous souhaitez modifier, et le modèle prédit si cette modification sera suffisante pour atteindre le résultat souhaité. Par exemple, vous pouvez demander au modèle de déduire si l’ajout d’un opérateur d’appel supplémentaire augmenterait la satisfaction des clients d’un point.

L’outil What-If utilise l’algorithme Microsoft Logistic Regression.

scénarioWhat-If (Outils d’analyse de tableau pour Excel)

Analyse du panier d’achat (Analyser)

L’outil d’analyse du panier d’achat crée des groupes de produits qui sont fréquemment achetés ensemble, afin d’identifier les modèles qui peuvent être utilisés dans la vente croisée ou la vente incitative. Il génère également des rapports basés sur le prix et le coût des offres groupées de produits connexes, afin d’aider à prendre des décisions.

Vous pouvez également utiliser cet outil pour les événements qui se produisent fréquemment, les facteurs menant à un diagnostic ou tout autre ensemble de causes et de résultats potentiels.

L’outil Analyse du panier d’achat utilise l’algorithme Microsoft Association.

Analyse du panier d’achat (Table AnalysisTools pour Excel)

Voir aussi

Exploration et nettoyage des données
Validation des modèles et utilisation de modèles pour la prédiction (compléments d’exploration de données pour Excel)
Déploiement et mise à l’échelle des modèles d’exploration de données (compléments d’exploration de données pour Excel)