Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Un AggregationDesign objet définit un ensemble de définitions d’agrégation qui peuvent être partagées entre plusieurs partitions.
Un Aggregation objet représente la synthèse des données de groupe de mesures à certaines granularités des dimensions.
Un objet simple Aggregation est composé d’informations de base et de dimensions. Les informations de base incluent le nom de l’agrégation, l’ID, les annotations et une description. Les dimensions sont une collection d’objets AggregationDimension qui contiennent la liste des attributs de granularité pour la dimension.
Les agrégations sont des résumés précalculés des données provenant de cellules feuilles. Les agrégations améliorent le temps de réponse des requêtes en préparant les réponses avant que les questions soient posées. Par exemple, lorsqu’une table de faits de l’entrepôt de données contient des centaines de milliers de lignes, une requête demandant les totaux hebdomadaires des ventes pour une ligne de produit particulière peut prendre beaucoup de temps pour répondre si toutes les lignes de la table de faits doivent être analysées et additionnées au moment de la requête pour calculer la réponse. Toutefois, la réponse peut être presque immédiate si les données de synthèse pour répondre à cette requête ont été précalculées. Cette précalculation des données récapitulatives se produit pendant le traitement et constitue la base des temps de réponse rapides de la technologie OLAP.
Les cubes sont la façon dont la technologie OLAP organise les données récapitulatives en structures multidimensionnelles. Les dimensions et leurs hiérarchies d’attributs reflètent les requêtes qui peuvent être demandées au cube. Les agrégations sont stockées dans la structure multidimensionnelle dans les cellules aux coordonnées spécifiées par les dimensions. Par exemple, la question « Quelles sont les ventes du produit X en 1998 pour la région Nord-Ouest ? » implique trois dimensions (Product, Time et Geography) et une mesure (Sales). La valeur de la cellule dans le cube aux coordonnées spécifiées (produit X, 1998, Nord-Ouest) est la réponse, une valeur numérique unique.
D’autres questions peuvent retourner plusieurs valeurs. Par exemple, « Combien ont été les ventes de produits matériels par trimestre par région pour 1998 ? » Ces requêtes retournent des ensembles de cellules à partir des coordonnées qui répondent aux conditions spécifiées. Le nombre de cellules retournées par la requête dépend du nombre d’éléments du niveau matériel de la dimension Product, des quatre trimestres en 1998 et du nombre de régions de la dimension Geography. Si toutes les données récapitulatives ont été précalculées en agrégations, le temps de réponse de la requête dépend uniquement du temps nécessaire pour extraire les cellules spécifiées. Aucun calcul ou lecture des données de la table de faits n’est nécessaire.
Bien que la précalculation de toutes les agrégations possibles dans un cube puisse fournir le temps de réponse le plus rapide possible pour toutes les requêtes, Analysis Services peut facilement calculer certaines valeurs agggrées à partir d’autres agrégations précalculées. En outre, le calcul de toutes les agrégations possibles nécessite un temps de traitement et un stockage significatifs. Par conséquent, il existe un compromis entre les exigences de stockage et le pourcentage d’agrégations possibles précalculées. Si aucune agrégation n’est précalculée (0%), la quantité d’espace de traitement et d’espace de stockage requis pour un cube est réduite, mais le temps de réponse des requêtes peut être lent, car les données requises pour répondre à chaque requête doivent être récupérées à partir des cellules feuilles, puis agrégées au moment de la requête pour répondre à chaque requête. Par exemple, le renvoi d’un seul nombre qui répond à la question posée précédemment (« Quelles étaient les ventes du produit X en 1998 pour la région Nord-Ouest ») peut nécessiter la lecture de milliers de lignes de données, en extrayant la valeur de la colonne utilisée pour fournir la mesure Sales de chaque ligne, puis en calculant la somme. De plus, la durée nécessaire à la récupération de ces données dépend très du mode de stockage choisi pour les données-MOLAP, HOLAP ou ROLAP.
Conception d’agrégations
Microsoft SQL Server Analysis Services intègre un algorithme sophistiqué pour sélectionner des agrégations pour la précalculation afin que d’autres agrégations puissent être rapidement calculées à partir des valeurs précalculées. Par exemple, si les agrégations sont précalculées pour le niveau Mois d’une hiérarchie de temps, le calcul d’un niveau trimestre nécessite uniquement la synthèse de trois nombres, ce qui peut être rapidement calculé à la demande. Cette technique permet de gagner du temps de traitement et de réduire les exigences de stockage, avec un effet minimal sur le temps de réponse des requêtes.
L’Assistant Conception d’agrégation fournit des options permettant de spécifier des contraintes de stockage et de pourcentage sur l’algorithme afin d’obtenir un compromis satisfaisant entre le temps de réponse des requêtes et les exigences de stockage. Toutefois, l’algorithme de l’Assistant Conception d’agrégation suppose que toutes les requêtes possibles sont également susceptibles. L’Assistant Optimisation Usage-Based vous permet d’ajuster la conception d’agrégation d’un groupe de mesures en analysant les requêtes soumises par les applications clientes. En utilisant l’Assistant pour paramétrer l’agrégation d’un cube, vous pouvez augmenter la réactivité aux requêtes fréquentes et réduire la réactivité aux requêtes peu fréquentes sans affecter considérablement le stockage nécessaire pour le cube.
Les agrégations sont conçues à l’aide des Assistants, mais elles ne sont pas réellement calculées tant que la partition pour laquelle les agrégations sont conçues est traitée. Une fois l’agrégation créée, si la structure d’un cube change, ou si les données sont ajoutées ou modifiées dans les tables sources d’un cube, il est généralement nécessaire de passer en revue les agrégations du cube et de traiter à nouveau le cube.