Aplicación de técnicas de agrupación en clústeres

4 minutos

La agrupación en clústeres permite identificar un segmento (clúster) de datos similares entre sí, pero diferentes al resto de los datos. El proceso de agrupación en clústeres es diferente al de la agrupación, de la que hablamos en la unidad anterior.

La característica de agrupación en clústeres de Power BI le permite encontrar rápidamente grupos de puntos de datos similares en un subconjunto de sus datos. Analiza el modelo semántico para identificar similitudes y diferencias en los valores de los atributos y, a continuación, separa los datos que presentan similitudes en un subconjunto de los datos. Estos subconjuntos de datos se denominan clústeres.

Por ejemplo, es posible que quiera buscar patrones en los datos de ventas, como el comportamiento general de los clientes. Puede segmentar los clientes en clústeres en función de sus similitudes, como la edad o la ubicación.

Para empezar, añada la visualización de gráfico de dispersión al informe y, después, los campos obligatorios al objeto visual. En este ejemplo, añadirá el campo Order Qty al "eje A", el campo Sales al "eje Y" y el campo Unit Price a los valores.

La siguiente imagen muestra muchos datos en el gráfico de dispersión, por lo que es difícil detectar grupos naturales.

Para aplicar la agrupación en clústeres al gráfico de dispersión, seleccione Más opciones (…) en la esquina superior derecha del objeto visual y, después, seleccione Buscar clústeres automáticamente.

En la ventana Clústeres, puede editar el nombre, campo y descripción predeterminados, si es necesario. Sin embargo, en este ejemplo le interesa cambiar el número de clústeres. La siguiente imagen muestra que el cuadro Número de clústeres está en blanco de forma predeterminada, lo que significa que Power BI encuentra automáticamente el número de clústeres que, en su criterio, es el más adecuado para sus datos.

Escriba el número de clústeres que quiere (3) en el cuadro y seleccione Aceptar. Power BI ejecuta el algoritmo de clústeres y crea un nuevo campo categórico que contiene diferentes grupos de clústeres. Ahora, cuando examine el objeto visual, podrá ver con más claridad los clústeres de los datos y continuar con su análisis.

El nuevo campo de clúster se añade al depósito Leyenda del gráfico de dispersión, que ahora puede usar como fuente de resaltado cruzado, igual que cualquier otro campo Leyenda. El nuevo campo de clúster se añade al modelo de datos, así que puede encontrarlo en el panel Datos.

Si quiere editar el clúster, haga clic con el botón derecho en el campo de clúster y seleccione Editar clústeres.

En el ejemplo anterior, al aplicar la agrupación en clústeres al gráfico de dispersión, solo se podían usar dos medidas. Si desea encontrar clústeres usando más de dos medidas, puede usar un objeto visual de tabla. En este caso, añada todos los campos que desee utilizar y, a continuación, ejecute el algoritmo de agrupación en clústeres siguiendo el mismo proceso.

Comentarios

¿Le ha resultado útil esta página?