Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette rubrique vous guide tout au long de la création d’un rapport de validation croisée à l’aide de l’onglet Graphique d’exactitude dans le Concepteur d’exploration de données. Pour obtenir des informations générales sur l’apparence d’un rapport de validation croisée et sur les mesures statistiques qu’il inclut, consultez Validation croisée (Analysis Services - Exploration de données).
Un rapport de validation croisée diffère fondamentalement d’un graphique de précision, tel qu’un graphique lift ou une matrice de classification.
La validation croisée évalue la distribution globale des données utilisées dans un modèle ou une structure ; par conséquent, vous ne spécifiez pas de jeu de données de test. La validation croisée utilise toujours uniquement les données d’origine utilisées pour entraîner le modèle ou la structure d’exploration de données.
La validation croisée ne peut être effectuée qu’en ce qui concerne un résultat prévisible unique. Si la structure prend en charge les modèles qui ont des attributs prédictibles différents, vous devez créer des rapports distincts pour chaque sortie prévisible.
Seuls les modèles liés à la structure actuellement sélectionnée sont disponibles pour la validation croisée.
Si la structure actuellement sélectionnée prend en charge une combinaison de modèles de clustering et de non-clustering, lorsque vous cliquez sur Obtenir les résultats, la procédure stockée de validation croisée charge automatiquement les modèles qui ont la même colonne prédite et ignorent les modèles de clustering qui ne partagent pas le même attribut prédictible.
Vous pouvez créer un rapport de validation croisée sur un modèle de clustering qui n’a pas d’attribut prédictible uniquement si la structure d’exploration de données ne prend pas en charge d’autres attributs prédictibles.
Sélectionner une structure minière
Ouvrez le Concepteur d’exploration de données dans SQL Server Data Tools (SSDT).
Dans l’Explorateur de solutions, ouvrez la base de données qui contient la structure ou le modèle pour lequel vous souhaitez créer un rapport.
Double-cliquez sur la structure d’exploration de données pour ouvrir la structure et ses modèles associés dans le Concepteur d’exploration de données.
Cliquez sur l’onglet Graphique d’exactitude de l’exploration de données .
Cliquez sur l’onglet Validation croisée .
Définir les options de validation croisée
Sous l’onglet Validation croisée , pour Nombre de plis, cliquez sur la flèche vers le bas pour sélectionner un nombre compris entre 1 et 10. La valeur par défaut est 10.
Le nombre de plis représente le nombre de partitions qui seront créées dans le jeu de données d’origine. Si vous définissez Fold Count sur 1, le jeu d’entraînement sera utilisé sans partitionnement.
Pour l’attribut cible, cliquez sur la flèche vers le bas, puis sélectionnez une colonne dans la liste. Si le modèle est un modèle de clustering, sélectionnez #Cluster pour indiquer que le modèle n’a pas d’attribut prédictible. Notez que la valeur, #Cluster, n’est disponible que lorsque la structure d’exploration de données ne prend pas en charge d’autres types d’attributs prévisibles.
Vous ne pouvez sélectionner qu’un seul attribut prédictible par rapport. Par défaut, tous les modèles associés qui ont le même attribut prédictible sont inclus dans le rapport.
Pour Max Cases, tapez un nombre suffisamment grand pour fournir un échantillon représentatif de données lorsque les données sont fractionnées entre le nombre spécifié de plis. Si le nombre est supérieur au nombre de cas dans le jeu d’entraînement du modèle, tous les cas seront utilisés.
Si le jeu de données d’apprentissage est très volumineux, la définition de la valeur pour Max Cases limite le nombre total de cas traités et permet au rapport de se terminer plus rapidement. Toutefois, vous ne devez pas définir le nombre maximal de cas trop faibles ou il peut y avoir des données insuffisantes pour la validation croisée.
Si vous le souhaitez, pour l’état cible, tapez la valeur de l’attribut prédictible que vous souhaitez modéliser. Par exemple, si la colonne [Bike Buyer] a deux valeurs possibles, 1 (Oui) et 2 (Non), vous pouvez entrer la valeur 1 pour évaluer la précision du modèle pour obtenir uniquement le résultat souhaité.
Remarque
Si vous n’entrez pas de valeur, l’option Seuil cible n’est pas disponible et le modèle est évalué pour toutes les valeurs possibles de l’attribut prédictible.
Si vous le souhaitez, pour le seuil cible, tapez un nombre décimal compris entre 0 et 1 pour spécifier la probabilité minimale qu’une prédiction doit être comptabilisée comme exacte.
Pour obtenir des conseils supplémentaires sur la façon de définir des seuils de probabilité, consultez Mesures dans le rapport de validation croisée.
Cliquez sur Obtenir les résultats.
Imprimer le rapport de validation croisée
Cliquez avec le bouton droit sur le rapport terminé sous l’onglet Validation croisée .
Dans le menu contextuel, sélectionnez Imprimer ou Imprimer l’aperçu pour passer en revue le rapport en premier.
Créer une copie du rapport dans Microsoft Excel
Cliquez avec le bouton droit sur le rapport terminé sous l’onglet Validation croisée .
Dans le menu contextuel, sélectionnez Sélectionner tout.
Cliquez avec le bouton droit sur le texte sélectionné, puis sélectionnez Copier.
Collez la sélection dans un classeur Excel ouvert. Si vous utilisez l’option Coller , le rapport est collé dans Excel en tant que code HTML, ce qui conserve la mise en forme des lignes et des colonnes. Si vous collez le rapport à l’aide des options Coller spécial pour le texte ou le texte Unicode, le rapport est collé au format délimité par des lignes.