Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Antes de poder usar expresiones multidimensionales (MDX) para consultar datos multidimensionales o crear expresiones MDX dentro de un cubo, ayuda a comprender los conceptos y términos multidimensionales.
El mejor lugar para empezar es con un ejemplo de resumen de datos que ya conoce y, a continuación, ver cómo se relaciona MDX con él. Esta es una tabla dinámica creada en Excel, rellenada con datos de un cubo de ejemplo de Analysis Services.
Medidas y dimensiones
Un cubo de Analysis Services consta de medidas, dimensiones y atributos de dimensión, todos los cuales son evidentes en el ejemplo de tabla dinámica.
Las medidas son valores de datos numéricos que se encuentran en celdas, agregadas como suma, recuento, porcentaje, mínimo, máximo o promedio. Los valores de medida son dinámicos, calculados en tiempo real, en respuesta a la navegación del usuario y a la interacción con la tabla dinámica. En este ejemplo, las celdas muestran los Montos de Ventas de Distribuidores que aumentan o reducen dependiendo de si expande o contrae los ejes. Para cualquier combinación de Fecha (año, trimestre, mes o fecha) y Territorio de ventas (grupo de países, país, región) puede obtener un importe de ventas de revendedor, sumado para ese contexto determinado. Otros términos que son sinónimos de medidas son hechos (en almacenes de datos) y campos calculados (en modelos de datos tabulares y excel).
Las dimensiones están en los ejes de columna y fila de una tabla dinámica, lo que proporciona el significado detrás de la medida. Las dimensiones son análogas a las tablas de un modelo de datos relacional. Entre los ejemplos comunes de una dimensión se incluyen Time, Geography, Products, Customers, Employees, etc. Este ejemplo tiene dos dimensiones, Sales Territory en las filas y Date en la parte superior, pero puede arrastrar y colocar fácilmente otras dimensiones asociadas a Reseller Sales, como Promociones o Productos, para ver el rendimiento de las ventas a lo largo de esas dimensiones. La capacidad de explorar datos de maneras interesantes depende de las dimensiones que cree y de si están relacionadas con las tablas de hechos del origen de datos.
Los atributos de dimensión son los elementos con nombre dentro de una dimensión, similares a las columnas de una tabla. En este ejemplo, los atributos de dimensión Sales Territory constan de Grupo de países (Europa, Norteamérica, Pacífico), País (Canadá, Estados Unidos) y Región (Centro, Noreste, Noroeste, Sudeste, Suroeste).
Cada atributo tiene una colección de valores de datos, o miembros, asociados a él. En nuestro ejemplo, los miembros del atributo Grupo de países son Europa, Norteamérica y Pacífico. Los miembros hacen referencia a los valores de datos reales que pertenecen a un atributo .
Nota:
Un aspecto del modelado de datos es formalizar los patrones y las relaciones que ya existen dentro de los propios datos. Al trabajar con datos que se dividen en una jerarquía natural, como sucede con países-regiones-ciudades, puede formalizar esa relación mediante la creación de una relación de atributo. Una relación de atributo es una relación uno a varios entre atributos, por ejemplo, una relación entre un estado y una ciudad: un estado tiene muchas ciudades, pero una ciudad pertenece solo a un estado. La creación de relaciones de atributo en el modelo acelera el rendimiento de las consultas, por lo que es un procedimiento recomendado crearlas si los datos lo admiten. Puede crear una relación de atributo en el Diseñador de dimensiones en SQL Server Data Tools. Consulte Definir relaciones de atributo.
Dentro de Excel, los metadatos del modelo se muestran en la lista de campos de la tabla dinámica. Compare la tabla dinámica que se encuentra arriba con la lista de campos que está abajo. Observe que la lista de campos contiene Territorio de ventas, Grupo, País, Región (metadatos), mientras que la tabla dinámica contiene solo los miembros (valores de datos). Saber el aspecto de los iconos puede ayudarle a relacionar fácilmente las partes de un modelo multidimensional con una tabla dinámica en Excel.
Jerarquías de atributos
Casi sin tener que pensar en ello, sabe que los valores de una tabla dinámica sube o baja mientras expande y contrae los niveles a lo largo de cada eje, pero ¿qué hace esto? La respuesta se encuentra en las jerarquías de atributos.
Contraiga todos los niveles y observe los totales generales de cada grupo de países y año natural. Este valor se deriva de algo denominado miembro (All) dentro de una jerarquía. El miembro (All) es el valor calculado de todos los miembros de una jerarquía de atributos.
El total (Todos) para todos los grupos de países y fechas combinadas es de $80.450.596,98
El valor total para CY2008 es de 16.038.062,60 dólares.
El miembro (Todos) del Pacífico es de $1,594,335.38
Las agregaciones como esta se calculan previamente y se almacenan de antemano, que forma parte del secreto para agilizar el rendimiento de las consultas de Analysis Services.
Expanda la jerarquía y, finalmente, llegue al nivel más bajo. Esto se denomina elemento hoja. Un miembro hoja es un miembro de una jerarquía que no tiene descendientes. En este ejemplo, Australia es el elemento hoja.
Todo lo anterior se denomina miembro primario. Pacific es el padre de Australia.
Componentes de una jerarquía de atributos
Juntos, todos estos conceptos se basan en el concepto de una jerarquía de atributos. Una jerarquía de atributos es un árbol de miembros de atributo que contiene los siguientes niveles:
Un nivel de hoja que contiene cada miembro de atributo distinto, con cada miembro del nivel de hoja también conocido como miembro hoja.
Niveles intermedios si la jerarquía de atributos es una jerarquía de elementos primarios y secundarios (más adelante).
Miembro (All) que contiene el valor agregado de todos los atributos secundarios. Opcionalmente, puede ocultar o desactivar el nivel (Todo) cuando no tenga sentido para los datos. Por ejemplo, aunque el código de producto es numérico, no tendría sentido sumar, promediar o de otro modo realizar una agregación de todos los códigos de producto.
Nota:
Los desarrolladores de BI suelen establecer propiedades en la jerarquía de atributos para lograr ciertos comportamientos en las aplicaciones cliente o obtener ciertas ventajas de rendimiento. Por ejemplo, establecería AttributeHierarchyEnabled=False en atributos para los que el miembro (All) no tiene sentido. Como alternativa, quizás simplemente quiera ocultar el miembro (All), en cuyo caso establecería AttributeHierarchyVisible=False. Consulte Referencia de propiedades de atributo de dimensión para obtener más detalles sobre las propiedades.
Jerarquías de navegación
Dentro de la Tabla dinámica (al menos en este ejemplo), los ejes de columna y fila se expanden para mostrar niveles inferiores de atributos. Un árbol expandible se logra mediante jerarquías de navegación que se crean en un modelo. En el modelo de ejemplo AdventureWorks, la dimensión Sales Territory tiene una jerarquía de varios niveles que comienza con un grupo de países, seguido de País, seguido de Región.
Como puede ver, las jerarquías se usan para proporcionar una ruta de navegación en una tabla dinámica u otros objetos de resumen de datos. Hay dos tipos básicos: equilibrados y desequilibrados.
Jerarquías equilibradas
|
Una jerarquía equilibrada es una jerarquía en la que existe el mismo número de niveles entre el nivel superior y cualquier miembro hoja. Una jerarquía natural es una que emerge naturalmente de los datos subyacentes. Un ejemplo común es Country-Region-State o Year-Month-Date o Category-Subcategory-Model, donde cada nivel subordinado fluye de forma predecible desde el elemento primario. En un modelo multidimensional, la mayoría de las jerarquías son jerarquías equilibradas y muchas de ellas también son jerarquías naturales. Otro término de modelado relacionado es , user-defined hierarchyque a menudo se usa como contraste con las jerarquías de atributos. Simplemente significa una jerarquía creada por el desarrollador de BI, en lugar de jerarquías de atributos generadas automáticamente por Analysis Services al definir un atributo. |
Jerarquías desequilibradas
|
Una jerarquía irregular o una jerarquía desequilibrada es una jerarquía en la cual hay diferentes números de niveles entre el nivel superior y los miembros hoja. De nuevo, es una jerarquía creada por el desarrollador de BI, pero en este caso hay lagunas en los datos. En el modelo de ejemplo AdventureWorks, Sales Territory muestra una jerarquía desigual porque Estados Unidos tiene un nivel adicional (regiones) que no existe para otros países en este ejemplo. Las jerarquías desiguales son un desafío para los desarrolladores de BI si la aplicación cliente no controla las jerarquías desiguales de una manera elegante. En el modelo de Analysis Services, puede crear una jerarquía de elementos primarios y secundarios que defina explícitamente una relación entre datos de varios niveles, lo que elimina cualquier ambigüedad en cuanto a cómo se relaciona un nivel con el siguiente. Consulte Parent-Child Hierarchy (Jerarquía deParent-Child ) para obtener más información. |
Atributos clave
Los modelos son una colección de objetos relacionados que se basan en claves e índices para crear las asociaciones. Los modelos de Analysis Services no son diferentes. Para cada dimensión (recuerde que es equivalente a una tabla de un modelo relacional), hay un atributo clave. El atributo clave se usa en relaciones de clave foránea con la tabla de hechos (grupo de medidas). Todos los atributos que no son clave de la dimensión están vinculados (directa o indirectamente) al atributo de clave.
A menudo, pero no siempre, el atributo clave también es el atributo granularidad. Granularidad hace referencia al nivel de detalle o precisión dentro de los datos. De nuevo, un ejemplo común ofrece la ruta más rápida de comprensión. Considere los valores de fecha: para las ventas diarias, necesita valores de fecha especificados al día; para las cuotas, a nivel trimestral podría ser suficiente, pero si los datos analíticos consisten en resultados de carrera de un evento deportivo, el nivel de detalle podría necesitar ser en milisegundos. El nivel de precisión en los valores de datos es el grado de detalle.
Moneda es otro ejemplo: una aplicación financiera podría realizar un seguimiento de los valores monetarios a muchos decimales, mientras que el recaudador de fondos de la escuela local podría necesitar solo valores para el dólar más cercano. Comprender la granularidad es importante porque quieres evitar almacenar datos innecesarios. El recorte de milisegundos de una marca de tiempo o centavos de una cantidad de ventas puede ahorrar tiempo de almacenamiento y procesamiento cuando ese nivel de detalle no es relevante para el análisis.
Para establecer el atributo de granularidad, use la pestaña Uso de dimensiones del Diseñador de cubos en SQL Server Data Tools. En el modelo de ejemplo AdventureWorks, el atributo clave de la dimensión Date es la clave Date. Para Sales Orders, el atributo granularidad es equivalente al atributo clave. En los Objetivos de Ventas, el nivel de granularidad es trimestral, por lo que el atributo de granularidad se establece en Trimestre del Calendario.
Nota:
Si el atributo de granularidad y el atributo clave son diferentes, todos los atributos que no son clave deben vincularse, directa o indirectamente, al atributo de granularidad. Dentro de un cubo, el atributo granularidad define la granularidad de una dimensión.
Ámbito de consulta (espacio de cubo)
El ámbito de una consulta hace referencia a los límites dentro de los cuales se seleccionan los datos. Puede oscilar entre todo el cubo (un cubo es el objeto de consulta más grande) a una celda.
El espacio del cubo es el producto de los miembros de las jerarquías de atributos de un cubo con las medidas del cubo.
Subcubo es un subconjunto de un cubo que representa una vista filtrada del cubo. Los subcubos se pueden definir con una instrucción de alcance en el script de cálculo MDX, en una cláusula de subselección en una consulta MDX, o como un cubo de sesión.
La celda hace referencia al espacio en la intersección de un miembro de la dimensión de medidas y un miembro de cada jerarquía de atributos de un cubo.
Otros términos de modelado
Esta sección es una colección de conceptos y términos que no encajan fácilmente en las otras secciones, pero que aún necesita conocerlos.
El miembro calculado es un miembro de dimensión que se define y calcula en el momento de la consulta. Un miembro calculado se puede definir en una consulta de usuario o en el script de cálculo MDX y almacenarse en el servidor. Un miembro calculado corresponde a las filas de la tabla de dimensiones de la dimensión en la que se define.
Distinct Count es un tipo especial de medida que se usa para los elementos de datos que solo se deben contar una vez. El modelo de ejemplo AdventureWorks incluye medidas de recuento distintas para pedidos de Internet, pedidos de revendedor y pedidos de ventas.
Los grupos de medida son una colección de una o varias medidas. En su mayoría, se definen por el usuario y se usan para mantener las medidas relacionadas juntas. Las medidas de recuento distintas son una excepción. Siempre se colocan en un grupo de medida dedicado que contiene solo la medida distinta. No puede ver el grupo de medida en la ilustración de ejemplo de tabla dinámica, pero aparece en una lista de campos de tabla dinámica, como una colección con nombre de medidas.
Measures es la dimensión que contiene todas las medidas de un cubo. No se expone en un modelo multidimensional que se construye en SQL Server Data Tools, pero existe de todos modos. Dado que contiene medidas, todos los miembros de una dimensión de medidas normalmente se agregan (generalmente por suma o por recuento).
Dimensiones de base de datos y dimensiones de cubo. Dentro de un modelo, puede definir dimensiones independientes que, a continuación, se incluyen en cualquier número de cubos del mismo modelo. Cuando se agrega una dimensión a un cubo, se denomina dimensión de cubo. Por sí mismo dentro de un proyecto, como un elemento independiente en el Explorador de objetos, se denomina dimensión de base de datos. ¿Por qué hacer la distinción? Dado que puede configurar propiedades en ellas independientemente. En la documentación del producto, verá ambos términos usados, por lo que merece la pena comprender lo que significan.
Pasos siguientes
Ahora que tiene un conocimiento de conceptos y terminología importantes, puede continuar con estos temas adicionales que explican aún más los conceptos fundamentales en Analysis Services:
Véase también
Espacio del cubo
Tuplas
Autoexists
Trabajar con miembros, tuplas y conjuntos (MDX)
Totales visuales y totales no visuales
Aspectos básicos de la consulta MDX (Analysis Services)
Aspectos básicos de scripting de MDX (Analysis Services)
Referencia del lenguaje MDX (MDX)
Referencia de expresiones multidimensionales (MDX)